首页 > 文档 > 学术/知识/论文 > IT/计算机/信息技术 > 自动化技术

面向工艺设计的领域大模型构建方法

2025-04-09 70 1.4M 0

　　面向工艺设计的智能化需求，领域大模型的构建方法成为关键研究方向.尽管大规模语言模型（Large Language Models,LLMs）的发展极大地推动了自然语言处理技术的进步，但工艺设计领域的数据通常存在样本稀缺、格式复杂以及缺乏结构化标签等问题，使得通用LLMs训练方法难以直接适用.此外，传统注意力机制在处理长文本和复杂任务时仍然面临计算复杂度高、资源消耗大、全局语义不稳定等挑战，进一步限制了大模型在工艺设计任务中的适应性.为解决这一问题，本研究提出了一种面向工艺设计的领域大模型构建方法，并在此基础上训练了具备100亿参数规模的工艺设计大模型——鲁班-10B.该方法引入混合稀疏注意力机制，通过保留起始词元的注意力权重，并基于查询内容动态选取相关性最高的若干历史词元，避免对完整序列计算密集型注意力矩阵，在有效降低计算复杂度的同时，提升模型对长文本中关键信息的建模能力.实验结果表明，鲁班-10B能够有效提升领域大模型在工艺设计任务中的适应能力与生成表现，为智能化工艺设计提供了新的技术路径与支撑.

您还没有登录，请登录后查看详情

大规模语言模型注意力机制长文本生成工艺设计

下一篇：9%Cr热强钢管道接头局部焊后热处理参数的优化
上一篇：贵州省滇楸天然林优树选择评价研究

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注2
~~没有留下签名~~~~

本类推荐

	基于混合双链量子遗传算法的干扰效能评估方法
	Markov切换拓扑下非线性多智能体系统量化一致性控制
	无人驾驶深度强化学习决策模型性能评测方法综述
	动态优先级调整的PMSM预测转矩控制
	弱刚度构件工业机器人铣削偏转误差建模
	智能化时代征收AI机器人税的路径选择——以激励科技发展与防范劳动力市场失衡为功能导向
	空间引力波探测惯性传感器及其关键技术
	基于平行多尺度时空图卷积网络的三维人体姿态估计算法
	基于标签感知变分自编码器的多标签分类
	稀疏高斯过程的五轴混联机器人加工姿态优化方法

下载排行