2023年AIGC发展速度惊人,迭代速度呈现指数级发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,都在助力AIGC的快速发展,越来越多的公司也积极参与到这场火热的大模型竞赛中。
近期,三大运营商纷纷发布大模型,国内互联网剧透阿里巴巴、字节跳动、百度等头部科技企业也早早开始了对大模型产业的布局。众视Tech对国内大企业重要AIGC大模型进行了盘点,汇聚最全信息,一睹为快。
国内 85个大模型图谱
AI大模型战场上,国外的OpenAI、谷歌、微软等大厂正打得火热;国内以百度、阿里、华为、腾讯为代表的科技巨头,科大讯飞、智谱AI、商汤科技等AI公司,三大运营商,以及智源研究院、中科院等学术/研究机构都纷纷投身AI大模型浪潮。 从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首。有专家披露,据不完全统计,目前中国大模型已发布 85 个以上。
国外大模型图谱:
国内大模型详解
NO.1 百度-文心大模型
文心一言
文心一言是百度推出的一款基于大语言模型的生成式AI产品,类似于ChatGPT。它可以根据用户的输入生成各种类型的文本,如诗歌、故事、对话等。据介绍,「文心一言」目前包含以下五类落地场景:文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成。文心一言是百度基于文心大模型技术推出的生成式对话产品。
文心大模型能为即将发布的生成式对话产品文心一言提供强大的技术支持。作为基于百度智能云技术打造出来的大模型,文心一言未来也将通过百度智能云对外提供服务,为产业带 来真正的AI普惠。
NO.2 科大讯飞-“星火”
讯飞星火认知大模型
“讯飞星火认知大模型”是科大讯飞发布的产品,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。并已在教育、办公、汽车、数字员工等行业中落地应用。
科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
NO.3 阿里-通义千问
通义千问
通义千问,是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。
阿里的通义千文大模型是一款基于Transformer架构的自然语言处理模型,由阿里巴巴自然语言处理实验室开发。该模型是目前国内最大的中文预训练模型之一,包含1000亿个参数。通义千文大模型通过在大规模语料库上进行预训练,可以实现多种自然语言处理任务,如文本分类、命名实体识别、情感分析等。此外,该模型还具有较强的迁移学习能力,可以在不同领域的数据上进行微调,适用于各种实际应用场景。
NO.4 商汤科技-日日新
商量SenseChat
“商量”是由商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型,具备超凡的语言理解、生成能力,将科技与人文相互交融。作为高效聊天助手,它能秒解复杂问题,提供定制化建议,还能辅助创作一流文本,具备不断学习进化的特性。
作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。商汤也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。
NO.5昆仑万维-「天工」
「天工」大语言模型
昆仑万维与国内领先的AI团队奇点智源联合研发正式发布「天工」大语言模型,这也是国内首个对标ChatGPT的双千亿级大语言模型。整体反馈来看,「天工」在文、理两个方面能力突出,通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。此外,针对应用范围最广的文案写作与知识问答场景,官方持续进行模型迭代与性能提升,使得「天工」从一诞生,就致力于成为真正“有用”的AI智能助手。
目前「天工」最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平。其产品完成度与体验成熟度已不仅仅停留在“尝鲜级”,而是款实际意义上的“应用级”产品。
NO.6 华为-“盘古”
「盘古」大模型
盘古大模型,是华为旗下的盘古系列AI大模型,包括NLP大模型、CV大模型、科学计算大模型。
盘古大模型从 2020 年启动研发,2021 年 4 月正式发布,到 2022 年聚焦行业应用落地, 其进化路径可分为 L0-L1-L2 三个阶段,上层是在下层的基础上演化而来。L0 是指基础大 模型,包括 NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模 型以及 Graph(图网络)大模型。 自然语言处理(NLP)系列是业界首个千亿级生成与理解中文 NLP 大模型,由华为云、循 环智能和鹏城实验室联合开发,在训练过程中使用了 40TB 的中文文本数据,其中包含大 量的通用知识与行业经验,具备领先的语言理解和模型生成能力,并通过行业数据的小样 本调优提升模型在场景中的应用性能。在中文语言理解评测基准 CLUE 榜单中,盘古 NLP 大模型在总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录,总 排行榜得分 83.046(人类水平为 85.61),多项子任务得分业界领先。
NO.7 360-“智脑”
360智脑大模型
360版GPT——认知智能通用大模型“360智慧大脑”(简称“360智脑”)多项能力位列国产大模型第一。在多轮对话测试中“360智脑”表现出优秀的上下文理解能力,代表着人工智能从感知进化到认知,是大模型真正智能的体现。
基于“360智脑”打造四大场景,具体包括:推出专有大模型,打造城市智能中枢和政府级、企业级GPT;携手行业伙伴打造金融、教育、医疗等产业级大模型;针对中小微企业推出AI垂直应用,打造生产力工具;结合搜索引擎和浏览器,推出针对个人用户的AI助理等。
NO.8 腾讯-“混元“
混元AI大模型
腾讯“混元”AI大模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。“混元”AI大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
目前,“混元“AI大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中。一方面,该模型能够帮助广告创作者和腾讯平台方预测视频内容与消费者群体之间的兴趣关联,提升创作效率;另一方面,能够有效提升广告推荐的精准度,让内容搜索和匹配更加精确,有效优化用户体验。
NO.9 京东-言犀大模型
言犀大模型
为夯实产业应用,京东推出了一套大模型的完整工具,包括支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。
依托京东言犀大模型,以及京东在产业和供应链侧的优势,京东还发布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。
NO.10 网易-玉言、子曰大模型
“子曰”“玉言”大模型
网易多款AI大模型落地产品首次亮相,集中展示了在人工智能基础设施层、引擎层、平台层、模型层、应用层的领先创新成果。会上,由网易有道自研的首个教育大模型“子曰”最新应用成果——虚拟人口语教练首次亮相。
除了口语训练外,据悉“子曰”大模型系列应用成果还包括中文作文指导与批改、英语习题精讲等多种教育领域细分应用。“子曰”大模型能够作为基座模型支持很多下游任务,为所有下游场景模型提供语义理解、知识表达等基础能力,是有道AI产品体系的核心。有道研发团队在子曰大模型的基础上,会为不同场景设计定制化模型,以实现模型与场景的高度契合。
此前网易伏羲实验室推出了中文预训练大模型“玉言”。公开资料显示,“玉言”大模型参数达到110亿,由浪潮信息提供AI算力支持。“玉言”大模型相关技术已用于网易集团内的文字游戏、智能 NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
NO.11 浪潮:源大模型
源大模型
源1.0是浪潮信息在2021年发布的人工智能巨量模型,单体模型参数量达到2457亿。作为通用NLP预训练模型,源1.0能够适应多种类的AI任务需求,降低针对不同应用场景的语言模型适配难度,并提升小样本学习与零样本学习场景的模型泛化应用能力。
此后,浪潮信息发布了基于“源1.0”大模型生成的4个技能大模型(SkillModel),分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”。这些技能大模型在各自细分领域的精度业界领先,可直接应用于人机交互、知识检索、语言翻译和文学创作等领域,模型运行速度最高提升9倍。更重要的是,基于大模型快速生成特定领域的技能大模型(Skill Model),也意味着“源”的AI生产力大幅升级,能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用,加速产业AI化。
NO.12 中国移动-“九天”1+N大模型
" 九天 " 人工智能大模型
中国移动正式发布 " 九天 " 人工智能大模型:九天 海算政务大模型和九天 客服大模型。目前,九天人工智能平台的技术团队拥有超过600名研发人员。
据了解,九天 海算政务大模型具备政务事项理解能力、多维度信息关联能力、面向复杂事项和复杂流程的多元交互能力,首创 " 政务大模型 — 信息场 — 应用 " 端到端政务服务体系,可以满足工作人员动态管理、公文写作等需求。 九天 客服大模型可根据用户提供的自然语言描述,解析问题并提供答案;还可与人工客服协作,分析历史沟通内容的语义和上下文,总结和归纳对话的重点和关键信息,为人工客服提供回复建议。
NO.13 中国电信-TeleChat大模型
大语言模型TeleChat
7月6日,中国电信数字智能科技分公司正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。
中国电信依托云网融合的优势,打造了中国电信的大语言模型TeleChat。TeleChat使用了大量高质量中英文语料进行预训练,并采用了千万级问答数据进行微调。同时,设计了渐进膨胀注意力机制,用于增加模型的间隔采样,扩大实际感受野;研发了自校准微调技术,将迭代后相关性偏差作为强化学习的监督信号,提升强化学习效果;并且利用知识图谱协同增强策略,通过知识图谱增强大模型的预训练和推理能力,减少大模型幻觉现象。
NO.14 中国联通-鸿湖大模型
鸿湖图文大模型1.0
中国联通发布了一项重要的技术创新成果——鸿湖图文大模型1.0。中国联通称,鸿湖图文大模型是首个面向运营商增值业务的大模型。
据了解,鸿湖图文大模型目前有两个版本,分别是拥有8亿训练参数和20亿训练参数的版本。这意味着该大模型具备了强大的计算和学习能力,能够实现多种复杂的图文处理功能。 以文生图是鸿湖图文大模型的一项重要功能。
通过该功能,用户可以输入文字描述,大模型能够自动生成相应的图像。这对于一些需要图像辅助的场景,如广告设计、创意表达等,具有重要的应用价值。 另外,鸿湖图文大模型还具备视频剪辑和以图生图的功能。视频剪辑功能可以根据用户提供的视频素材,自动进行剪辑和编辑,生成符合用户需求的视频作品。而以图生图功能则可以根据用户提供的图像,生成新的图像,为用户提供更多的创作灵感。
NO.15 上海 AI 实验室-书生
“书生 浦语”
今天,上海人工智能实验室(上海 AI 实验室)、商汤科技联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生 浦语”(InternLM)。“书生 浦语”具有 1040 亿参数,是在包含 1.6 万亿 token 的多语种高质量数据集上训练而成。
上海人工智能实验室称,全面评测结果显示,“书生 浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越 ChatGPT 的成绩,其中就包括中国高考各科目的数据集(GaoKao)。
NO.16 中国科学院-紫东太初大模型
紫东太初
紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台 ,首次发布于 2021 年 7 月。紫东太初是图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力。
2023年6月16日,中国科学院自动化研究所发布紫东太初2.0。相比1.0版本,在语音、图像和文本三模态的基础上,加入视频、传感信号、3D点云等模态数据,研究突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力和关联能力,面向数字经济时代加速通用人工智能的实现。 紫东太初 2.0以自动化所自研算法为核心,以昇腾AI硬件及昇思MindSpore AI框架为基础,依托武汉人工智能计算中心算力支持,着力打造全栈国产化通用人工智能底座。
NO.17 清华-“ChatGLM-6B”
ChatGLM-6B
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。
NO.18 复旦-“MOSS”
MOSS
MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
扫描二维码参与灵境杯大赛上海站报名
为您推荐
北京IPTV现在已经将AIGC应用到平面层面,界面海报基本都是利用AIGC快速制作形成。同时,产业内其他企业正在尝试将AIGC等新兴技术应用到更多层面。
7月20日消息,谷歌正在测试一款利用 AI 技术制作新闻报道的产品,内部代号为“Genesis(创世纪)”,并已向《纽约时报》、《华盛顿邮报》和拥有《华尔街日报》新闻集团的高管进行了演示。谷歌认为该工具可作为记者的个人助理自动完成一些任务,并帮助出版业者“远离 AI 陷阱”。对此,纽约时报评论员、新闻学教授 Jeff Jarvis 表示,该工具具有潜在缺点。
2023ChinaJoy期间,新壹科技宣布发布视频行业大模型“新壹视频大模型”,以及AIGC视频生成平台“秒创视频创作平台”。