1. 主页 > 一问一答

职场上对AIGC大模型训练师有什么要求?

Q:AIGC大模型训练师有什么要求?

A:AIGC大模型训练师是指专门从事大规模深度学习模型训练和优化工作的专业人员。他们主要负责在AIGC大模型中,利用大量的数据和计算资源来训练和优化这些具有大规模参数的深度学习模型,例如神经网络。


这些大模型的目标是能够处理更复杂的任务,并且具备更好的性能和泛化能力。大模型训练师需要熟练掌握各种深度学习算法和模型架构,同时需要拥有大量的计算资源和数据来支持模型的训练和优化。他们需要在大规模数据上进行数据清洗、预处理、特征提取等工作,以帮助模型更好地学习和理解数据。此外,他们还需要设计和调整模型结构、超参数等,以实现更好的模型性能和精度

大模型训练师还需要具备较好的数学和统计素养,同时拥有良好的编程能力和计算思维能力。他们还需要具备团队合作精神和良好的沟通能力,以与其他工程师和科学家合作完成复杂的项目任务。

出门问问AIGC大模型“序列猴子”.jpg

出门问问AIGC大模型“序列猴子”

以下是一些行业招聘AIGC大模型训练师的要求,不妨可以从中解读一下:

职位:大模型算法负责人P9

任职要求:

【大模型算法负责人】 职级L10+,基座模型训练背景,重点下海外OpenAI、Deepmind、Google、Meta等。国内也可以看。

职位:NLP大模型平台研发专家P7-8

人选关键词:统招硕士及以上985,211

关键内容:优先看有LLM训练经验的

工作职责:

1. 研究业界最前沿的NLP大模型及相关工程化工作,解决大模型业务落地的事实可靠性、长上下文理解、服务性能等相关技术障碍,形成大模型推理/微调服务、AI应用工具链等平台化能力

2. 协同跨团队技术和业务同学共同达成技术和业务目标,支撑智能客服、理财/保险支小宝、外呼平台、数字人等多种场景

任职要求:

1. 计算机相关专业,有结合算法进行复杂系统开发的经验(如搜索、推荐系统)

2、熟悉主流深度学习、大规模语言模型等算法及原理;

3、良好的学习和沟通能力,有责任心,有钻研精神;

4、熟悉或者具备以下一个或者多个方向的经验优先: 1)具备优秀的代码开发能力,有高质量开源项目开发经验; 2)有大规模机器学习、深度学习系统研发及优化经验,有AIOPs相关经验。 3)对主流大语言模型有优化或研究经验,熟悉常见的模型小型化和加速技术; 4)有大规模数据并行、模型并行、流水线并行等技术有实践经验。

职位:大模型算力加速工程师P7-8

工作职责:

1、参与大模型离线训练的效率和稳定性提升的工作;

2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作;

3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用。

任职要求:

1、编程基本功扎实、熟悉常用数据结构和算法;

2、熟悉模型运行软硬件基本原理,有模型性能优化的相关经验;

3、熟悉开源框架Pytorch、TF,有模型开发实践经验;

4、了解LLM(Large Language Model)基本原理,有模型训练的相关经验;

5、对搜索业务和行业有较深理解。

职位:大模型训练专家P7-8

工作职责:

1. 使用已经整理好的据进行分布式模型训练;

2. 尝试不同的网络结构、损失函数、超参数,提升模型性能;

3. 详细记录各类实验结果,形成实验报告并进行总结;

4. 根据项目实际需求,调整模型大小,寻找合理有效的prompt;

5. 针对部分任务,设计合适的fine tuning数据集对预训练模型进行微调;

任职要求:

1. 计算机专业背景,硕士及以上学历为佳;

2. 有3年以上的深度学习算法实践经验,代码能力强;(不仅限于工作经验,博士硕士阶段的实践也符合要求) 3. 精通Pytorch等;

4. 熟悉预训练模型相关的知识;

5. 有分布式训练经验者优先;

6. 有冒险精神,对事物有强烈的好奇心,愿意不断学习,不断提升。

职位:数据挖掘工程师P7-8

职位职责:

1. 设计、开发和优化数据清洗、挖掘和处理流程,以确保数据质量、安全性和多样性。

2. 进行数据质量评估和安全性识别,识别并清除有误的、低质量的和不安全的数据。

3. 进行多样性识别和评估,确保训练数据的多样性,减少模型的过拟合风险。

4. 协同团队开发和优化自动化数据清洗/挖掘和预处理工具,提高数据处理效率和准确性。

职位要求:

1. 熟悉常用的数据清洗和挖掘工具。

2. 熟悉数据质量评估和安全性识别方法和工具,例如数据标注工具、质量评估工具、敏感数据识别工具等。

3. 具有一定的编程能力和经验,熟悉至少一种编程语言,例如 Python、Java 等。

4. 有丰富的数据挖掘和处理经验,能够熟练运用统计学、机器学习等方法。

5. 具备团队协作精神和沟通能力,能够与团队中的其他成员进行高效合作,完成团队目标。

职位:大模型推理工程师

岗位职责:

1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。

2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。

3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。

职位要求:

1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。

2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。

3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。

4. 熟悉LLM相关的算法技术以及推理加速方法。

5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。

职位:搜索研发工程师

职位职责:

1. 负责搭建高效的搜索系统,包括但不限于搜索引擎、数据存储、分布式计算、自然语言处理等方面的研发工作。

2. 根据业务需求,持续优化搜索算法和相关技术,提高搜索系统的性能和用户体验。

3. 负责搜索系统的架构设计、性能测试、监控和调优等工作。

4. 与产品和运营团队紧密合作,理解用户需求和行为,为产品和运营提供技术支持和优化建议。

职位要求:

1. 具备扎实的计算机基础知识,熟悉常用数据结构和算法。

2. 熟练掌握至少一门编程语言,例如 C++、Java 等。

3. 熟悉常用的搜索引擎和相关技术,例如 Elasticsearch、Lucene、Solr 等。

4. 具备分布式系统和大规模数据处理的实际经验,熟悉 Hadoop、Spark、Flink 等技术。

5. 具备良好的沟通能力和团队合作精神,能够与不同背景和领域的同事合作开展项目工作。

工作地点:北京、上海、杭州、深圳

本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/QA/454.html