Find Your Dream Job

Search through thousands of job postings to find your next opportunity

Date Posted

Job Type

Technology

Work Setting

Salary Range

$0k $100k $200k+

Experience Level

Site Reliability Engineer (SRE) - (on behalf of Tuwaii)

CTW Inc

Shanghai, Shanghai, China

▍ 工作内容:

  • 设计、开发和维护高可靠性、可维护性和可扩展性的云原生系统、与平台及游戏开发团队高效沟通。
  • 设计、开发和维护平台的自动化工具、CI/CD和运维流程,保证应用的快速部署与系统的高可用性。
  • 设计、开发和维护平台基于公有云与K8s搭建的各PaaS系统、加速平台应用与游戏的上线。
  • 分析并优化各系统性能、集群配置和故障模式,并落地最佳实践。
  • 监控平台与游戏各系统,及时响应并解决生产环境中的问题,减少故障恢复时间。
  • 参与轮班值守,及时响应紧急事件,并进行事后分析以防止问题再发。
  • 编写和维护技术文档,包括系统架构、运维SOP、游戏对接、故障处理指南等。


Requirements

▍ 基本要求:

  • 计算机科学、信息技术或相关专业毕业。
  • 至少3年以上使用 Kubernetes 的经验,熟悉 Kubernetes 的架构、原理和操作。
  • 精通至少一种编程语言(如 golang, python等)。
  • 有在生产环境中使用监控工具(如 Prometheus、Grafana)的经验。
  • 具备故障诊断、性能优化和事故处理的实践经验。
  • 良好的项目管理和沟通能力。

▍ 优先考虑:

  • 有使用云服务(如 AWS 或 Aliyun)的经验。
  • SRE 认证或相关领域的专业认证。
  • 有领导小团队或项目的经验。


Benefits

  • 五险一金
  • 免费饮料和零食
  • 免费午餐
  • 海外研修交流机会
  • Working hours: 9:00 - 18:00, in-office

Tuwaii(上海途未科技)是一家专注于利用人工智能(AI)革新游戏产业的初创公司。我们积极与海外的合作伙伴共同开发H5游戏平台,并与知名动漫品牌合作,致力于推广和发扬各种二次元文化IP。

我们的游戏平台已成功推出30款以上精选二次元动画的游戏作品。我们的游戏玩家遍布全球,每月有超过200万玩家访问我们的游戏平台,总计高达数亿次的广告曝光。

我们采用先进的大语言模型(LLM)和人工智能生成技术(AIGC)来持续优化我们的游戏产品和业务,包括以下多个游戏业务领域:

  • 海外广告投放
  • 海量数据分析
  • 游戏素材制作
  • 全球支付平台
  • 认证平台
  • 游戏内容国际化
  • 游戏系统云原生化

我们诚邀您加入我们的团队,使用AI的力量,共同打造行业领先的游戏平台和产品,推动行业的发展。

New SRE Jobs

Connecting top SRE talent with leading companies.

For SRE Professionals

For Employers

Company