As the AI Solutions Architect, you will be the primary technical leader and customer advocate for Alibaba Cloud's cutting-edge AI Model-as-a-Service (Model Studio) and Tongyi Models (Qwen & Wan) offerings. You will guide our enterprise clients in leveraging the power of AI to solve their most complex business challenges and drive innovation.
[Core Responsibilities]
1、深入理解阿里云AI智算集群的技术原理、架构和使用场景,根据客户需求,设计并实施高性能、可扩展的AI基础设施解决方案,核心聚焦于大模型的训练与推理场景,促进商业化合作达成。
2、具备良好的架构思维,能够从稳定性、高性能、易用性、可用性、可运维性等方面综合考虑,基于阿里云IaaS和PaaS的全栈AI基础设施,确保从算力、网络、存储的极致优化,持续为客户提供高质量AI基础设施服务。
3、面向国际市场,总结分析AI智算发展趋势/市场竟争格局,主动挖掘行业数据和客户商机,建立可复制的行业解决方案,与产研团队紧密配合,推动产品能力和营收持续增长。
4、具备需求拆解和整合的能力,成为对内外部AI智算技术的传播者,能够将复杂的AI基础设施技术转化为清晰的商业价值,成为客户和内部团队信赖的技术顾问。
5、作为领域专家参与客户Workshop、市场洞察等活动,并在行业峰会、技术沙龙等市场活动中进行阿里云AI智算技术传播和分享。
[Basic Qualifications]
1、3年以上工作经历,具备AI、高性能计算或云计算基础设施相关经验,对大模型训练/推理的底层技术栈有深刻理解。
2、精通主流云平台的IaaS、PaaS层服务,特别是计算、网络和存储。 具备云原生应用的设计和部署经验,能够设计和实现基于云的高可用性和高扩展性的AI智算集群解决方案。
3、精通分布式计算架构(如Hadoop、Docker、Kubernetes、Serverless等容器和云原生技术),深入了解GPU/TPU/DPU计算和高性能网络原理(RoCE和IB),具有实际优化集群计算及网络资源的经验。
4、具备优秀的沟通协调和演讲能力,能够与外部客户以及内部团队进行有效的技术交流,并撰写技术方案文档,向客户团队清晰传达技术决策和设计思路,有云产品售前实际经验者优先。
5、具备良好的复杂项目协调能力和问题解决能力,强大的沟通能力和团队协作精神,能够快速定位并解决复杂的技术问题。
6、对AI技术发展趋势保持高度敏感,具备持续学习的热情和能力。
7、对海外云厂商、行业生态的发展趋势有思考和理解,通过海外客户需求推动阿里云能力提升,打造阿里云行业竞争壁垒;能与来自不同国家和文化背景的团队工作协同,推动项目拿到结果。