在一个深处的森林里,有一棵已经存在了一千年的老柯树。据传说,只要孩子们沉入它的树洞中的梦境,他们就能实现任何愿望……这个奇幻的场景是大江健三郎在他的著作《两百年的孩子》中描绘的,并且这也是他向之前的作品《给新新人类》致敬的方式
关于“新新人类”,最早的说法源自一则开喜乌龙茶的广告创意,而大江健三郎讲述的故事显然更具隐喻意味——那棵古树代表了千年文明的知识积累,孩子则是每个时代都可能催生的“新新人类”,只不过“树洞”在不同时期表现形式千差万别。
大模型时代的“树洞”在哪里呢?“新新人类”又会以怎样的面貌呈现?在华为全联接大会2023期间,华为联合紫东太初、智谱AI、讯飞医疗、宇树科技等伙伴发布智能数字人、智能编程助手、智能医疗助手、智能巡检机器人,打造“AI新新人类”,加速场景化大模型商用落地
重写后的内容:当大型模型的开发和应用遇到瓶颈时,基于知识库的新型存储产品成为了突破困境、孕育奇迹的"树洞"。由此诞生的"AI新新人类"将成为新时代的潮流引领者。有趣的是,旧人类、新人类和"AI新新人类"的故事才刚刚开始
大模型时代堪称新生物种的“寒武纪”
从5亿3000万年前起,大约在2000多万年时间内,门类众多的无脊椎动物化石突然出现,但在早期更为古老的地层中,却至今没有找到其祖先化石——这就是著名的“寒武纪生命大爆发”。
今年初开始的AIGC风潮,使得人工智能进入了大模型时代,预计会出现前所未有的新生物种。然而,大模型在开发和运作过程中面临着许多挑战,这在一定程度上阻碍了应用的实际推广
首先,数据准备时间长,数据来源分散且归集慢,预处理百TB数据需10天左右。其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s。再次,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,故障恢复耗时超过1天。最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%
就像“寒武纪生命大爆发”需要地球的温度、湿度、含氧量等都达到适宜新物种诞生的水平,大模型时代同样要改变基础的环境要素,才能加快场景化落地的步伐。打造大模型时代的AI存储新品,正是直面痛点的应时之举。
今年7月,华为重磅推出FusionCube A3000 训/推超融合一体机,集高性能存储节点、训推节点、网络设备、AI平台软件于一体,客户可以一站式部署,开箱即用,大幅降低AI大模型的前期使用、部署门槛与成本投入。
华为目前已经与多家合作伙伴展开合作,并在存储新产品方面取得了实质性的成果展示。通过大规模生成“AI新新人类”场景化大模型,华为在商用领域树立了新的标杆。在知识库存储的推动下,将会有更多的AI机器人和全新的物种健康成长
AI新新人类迈向加速进化期
华为公司副总裁、数据存储产品线总裁周跃峰博士指出,历经千年的文明孕育了千行万业,并在历史的积淀中形成了大量的知识库。在人工智能大模型的时代,只有将这些知识库赋予大模型,机器人的智能才能够进行“思考”,从而进化出适用于各种场景的全新人工智能
华为公司副总裁、数据存储产品线总裁周跃峰博士
如果说数据决定人工智能的高度,那么知识库则是人工智能新人类成长的阶梯。华为存储以数据为基础,将行业专有知识库与强大的模型能力充分结合,与合作伙伴共同推动人工智能新人类的不断进化
在AI新新人类的大家族中,智能数字人也许是“最靓的仔”。紫东太初基于训/推超融合一体机、紫东太初大模型和智能数字人知识库,推出存储智能小海、政务前台、办税助理等智能数字人。其中,存储智能小海是华为数据存储产品线的第一名数字员工,将为华为销售人员和商业市场伙伴提供售前技术咨询,具备智能问答、意图查询、内容生成等功能。
根据相关统计数据显示,中国的数字人领域正在迅猛发展,预计到2026年,整个市场规模将达到1024亿元。然而,新兴的数字人赛道也面临着一些成长的困扰。例如,面向不同行业的多模型应用落地时,传统的交付方式通常涉及多个硬件的拼装,这导致设备交付困难、数据容易泄露、定制方式复杂以及运行容易中断等问题
针对上述难题,双方联合打造的训/推超融合一体机内置华为硬件、容器平台和紫东太初全链路工具链,实现一柜软硬件全集成。从设备组装、部署到训推、运维,紫东太初和华为提供全流程的工具和软件,最终达成智能数字人上线时间缩短到2天、开发周期缩短到7天。
在AI新新人类最容易切入的“工种”中,编程应该是典型代表。智谱AI基于华为FusionCube A3000训/推超融合一体机、智谱CodeGeeX 编程大模型以及企业业务代码知识库,打造智能编程助手,实现智能问答、代码生成与补全、测试用例生成、代码优化、自动添加注释、代码翻译等功能,可通过语义分析和查询技术检测代码中的漏洞和缺陷,让程序员尽享编程乐趣。
从场景适宜度的角度看,医疗行业也是AI新新人类施展身手的大舞台。华为与讯飞医疗共同打造智能医疗助手,其基于华为FusionCube A3000训/推超融合一体机、讯飞星火大模型和医疗知识库,实现语音病历、会诊助手、智能查房、智能随访等功能,让每个患者都有一个AI健康助手,每个医生都有一个AI诊疗助理。
除了锦上添花,AI新新人类还能在充满风险和不确定性的场景雪中送炭。华为联合宇树科技,基于华为FusionCube A3000训/推超融合一体机、宇树巡检机器人和智能巡检知识库,打造电力场站智慧巡检员,实现智能导航、态势研判、语音识别、资产盘点、智能报表等功能,让巡检更智能、高效、安全。
知识库存储为AI新新人类保驾护航
不难看出,AI新新人类的涌现呈现出井喷特征,场景化大模型商用落地的进程明显提速,预计会有更多的智能机器人脱颖而出,赋能千行万业的智能化转型。
当然,阻碍AI大模型“高产”的诸多因素并未完全消除,AI知识库存储还有很长的路要走。面对新征途上的挑战,华为推出OceanStor A800高性能AI知识库存储,着力解决大模型训练和推理过程中的数据处理效率瓶颈,加速大模型应用上线。
根据了解,OceanStor A800具备超高性能、超快恢复、超强推理三大关键能力。首先,它采用创新的数控分离架构,大幅提升小文件处理性能,存储单框IOPS达到2400万。其次,通过采用创新的盘控协同技术和NFS+并行客户端,实现了500GB/s的超高带宽,TB级Checkpoint大文件的读写仅需十几秒。最后,它内置高速向量知识库,提升了大模型行业知识的深度、精度和时效性,并通过智能向量检索引擎实现了25万+QPS的推理响应,毫秒级的响应时间
站在更长远的视角来看,AI知识库存储的持续进化将进一步优化大模型时代的“气候环境”,AI新新人类英才辈出、迭代升级的未来图景值得期待。下一个AI新新人类会在哪里出现?看看你我的身边,它们可能随时现身。