职位描述:
1、负责公司基础设施的规划、建设和管理,组织实施公司IT基础设施(服务器、存储、超融合、虚拟化、机房等)运维管理,确保可用性、稳定性、安全性
2、负责公司操作系统、数据库、中间件、容器等基础软件的安装部署、性能调试、运行管理以及日常维护:
3、参与制定基础设施、基础软件的运维规范,持续改进运维流程和质量,对基础设施进行性能分析、优化、问题跟踪及故障排除;
4、负责公司监控系统、自动化系统、ITIL平台的持续建设和日常管理
5、组织推进公司重要系统的业务连续性建设和容灾方案
6、在规定的信息安全体系指导下通过各类工具保证各项系统的高可用、高稳定、高安全运行
7、负责GPU服务器/集群的硬件部署、调试、监控及故障排查
任职要求:
1、硕士及以上学历,计算机或相关专业,3年以上的相关工作经验,有证券、基金、银行等金融从业经验者优先
2、精通windows/linux(rhel/centos/almal/rocky/Euler/kylin)等操作系统的系统维护、性能调优、配置管理以及安全防护
3、精通shell/python等脚本语言运用于日常系统维护
4、熟悉容器技术、架构和技术原理,有k8s+docker架构的经验者优先
5、熟悉主流的数据容灾架构和平台,有"两地三中心"建设经验者优先
6、熟悉常用的基础云工具平台,如vmware,华为云等;了解各类常用自动化平台如zabbix,puppet,ansible等
7、熟悉NVIDIA/AMD/国产GPU架构,了解GPU虚拟化技术(如NVIDIA vGPU、Kubernetes DevicePlugin、MIG等)。
8、具有较强的沟通能力和协调能力;具备较强的学习能力、思维敏捷具有一定的抗压能力