混元大模型通过腾讯云开放预训练超2万亿tokens

混元大模型通过腾讯云开放预训练超2万亿tokens

9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式向公众亮相,同时宣布将通过腾讯云对外开放。

腾讯集团高级执行副总裁、云与智慧产业群CEO唐道生表示,混源大模型是腾讯全链路自研的通用大语言模型,参数规模超千亿以及超过 2 万亿个代币的预训练语料库。

唐道生表示,混元大模型具有较强的中文理解和创造能力、逻辑推理能力、可靠的任务执行能力游戏ui设计规范,在解决大模型常见的“错觉”问题上取得了重大进展。

未来,它将作为腾讯云MaaS服务的基地。 客户不仅可以通过API直接调用混元,还可以以混元为基础模型,开发不同行业场景的应用。

据腾讯官方信息,腾讯已与11000家外部合作伙伴推出了覆盖100多个行业场景的行业解决方案。 去年,生态合作伙伴收入占腾讯云整体收入的三分之一,收入增速是腾讯云的四倍。

会后接受采访时,腾讯集团副总裁蒋杰向界面新闻等媒体表示,混元模式已接入腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档等50多个腾讯业务。 、微信搜一搜和QQ浏览器等业务和产品同时取得了不错的成绩。

设计游戏和游戏规则_游戏设计遵循哪些规则_游戏ui设计规范

全链路自研

2021年开始,腾讯陆续推出千亿、万亿参数的大规模NLP稀疏模型,打破三大CLUE榜单记录,实现中文理解能力新突破。

蒋杰透露,腾讯混元模型从第一个代币开始就从零开始训练,掌握了从模型算法到机器学习框架再到AI基础设施的全链路自研技术。

他认为,目前大模型在业界的应用仍然局限于场景,主要集中在容错率高、任务简单的休闲场景。 腾讯在算法层面进行针对性研发,解决目前大型模型中存在的“错觉”问题。

针对大模型容易出现“乱码”的问题,腾讯优化了预训练算法和策略,与主流开源大模型相比,将混元大模型的错觉降低了30%~50%。

游戏设计遵循哪些规则_设计游戏和游戏规则_游戏ui设计规范

同时,通过强化学习方法,模型学会识别陷阱问题,能够拒绝回答不恰当的用户问题; 通过位置编码优化,提高超长文本的处理效果和性能。

此外,腾讯研发团队还提出了思维链新策略,让大型模型能够像人类一样根据实际应用场景进行推理和决策。

蒋杰表示,腾讯自主研发的机器学习框架Angel相比业界主流框架,训练速度提高了一倍,推理速度提高了1.3倍。

因此,腾讯的混元大模型能够理解上下文的意思,具备记忆长文本的能力,能够顺利地进行专业领域的多轮对话。 腾讯表示,可以进行文学创作、文本摘要、角色扮演等内容创作,充分了解用户意图,高效准确地提供及时响应。

发布会上,蒋杰还利用中国信息通信研究院《大规模预训练模型技术及应用评估方法》的标准符合性测试结果,确认了混元大模型的能力。

游戏设计遵循哪些规则_设计游戏和游戏规则_游戏ui设计规范

本次评价中,混源大模型共评价了66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价中获得了目前最高分。 在主流评估集MMLU、CEval和AGI-eval上,大型混合模型具有优异的性能。

腾讯全面拥抱大模型

蒋杰在发布会上表示,腾讯开发大模型的目标不是为了在评测中获得高分,而是将技术应用到实际场景中。 “腾讯将全面拥抱大模式。”

他还展示了腾讯会议、腾讯文档、腾讯广告等业务接入腾讯混元大模型后的实际应用。

例如,腾讯会议基于混元大模型开发的AI助手,只需要简单的自然语言指令即可完成会议信息提取、内容分析等复杂任务,并且还可以在会后生成智能摘要纪要。

游戏ui设计规范_游戏设计遵循哪些规则_设计游戏和游戏规则

经实测,混元大模型在命令理解、会议问答、会议总结、会议待办事项等多方面都取得了较高的用户采用率,相比GPT3.5有明显优势。

在文档处理方面游戏ui设计规范,腾讯混元大模型支持数十种文本创建场景音乐音效,可一键生成标准格式文本,熟悉上百种Excel公式,支持自然语言生成功能像素游戏素材,可根据表格内容生成图表。

腾讯表示,这些文档处理功能目前处于内测阶段,成熟后将向用户开放。

在广告业务场景中,腾讯混元大模型支持智能广告素材创作,可以结合行业和地域特点,实现文字、图片、视频的自然融合。

今年6月,腾讯云推出模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型微调、智能应用开发等一站式行业大模型服务。

姜杰表示,腾讯云已全面集成Llama 2、Bloom等20余款主流机型,并支持直接部署和调用。 客户可以根据实际需求构建自己的行业模型,可以基于混元模型,也可以基于开源模型。

文章来源:https://www.toutiao.com/a7275946592731939328/