企业选择大模型,为什么必看“领域认知智能”?
这半年来,大模型走出“尝鲜期”,渗入产业发展。
所有的大模型都在寻找出路,试图将技术想象力转化为切实生产力。制造、金融、政务、交通等领域纷纷成为试水对象,与大模型的应用结合或深或浅,但目前看,尚未迎来声势浩大的“落地潮”。
这不是大模型的理念技术问题,是融合问题。
不同行业、规模的企业需求各异,无论是通用大模型还是垂直大模型,在深入领域解决复杂问题上仍旧很青涩,这也让企业对大模型充满不确定、不信任。
如何打破这层信任壁垒?10月24日,爱数领域认知智能解决方案全国巡展从北京站正式开启,面向特定技术或行业领域,从领域数据源头着手,对大模型进行预训练或调优,从以前的私域数据到现成的领域知识网络,这是爱数给出的答案。
01 解决企业真正要什么
没有企业不想跟上大模型的风口,关键是怎么跟。
大模型诞生的初衷是为人服务,可以拿来聊天写诗,也可以一键生成绘画等等。但是做“玩具”终归不是长久之计,拥抱行业应用,才有希望看到真金白银的回报。
要怎么敲开千行百业大门?以技术为主体的老路显然行不通。对于大模型技术,越是大型的企业,越是核心的系统,应用越谨慎。
厂商唯一的办法是深入领域、深入业务场景当中去,以客户为主,将企业需求放在第一位。
这时候,我们看到微软、谷歌、百度、华为等科技巨擘陆续下场,推动行业化的垂直大模型,把深入特定领域和应用场景,作为商业化价值的体现,例如金融大模型、政务大模型、能源大模型等等。
不过,其中的商业化阻碍依然存在。
比如说,通用大模型和垂直大模型都存在的可解释性差问题。简单来说,是因为大模型规模大、参数众多,导致模型内部结构和决策过程变得非常复杂,这使得外界无法获取参数之间的逻辑发展关系,也就很难直观地理解模型行为。
而对于医疗、金融、航空航天等对安全合规“吹毛求疵”的领域,任何不确定性都有可能成为风险事故。
因此,要想深入行业领域,大模型还须将这些“拦路虎”一一化解,为企业提供足够的安全和可靠保障。
02 落地领域的最优解
大模型落地领域,说到底是让领域内的企业买账,要企业看到部署的好处,感到物有所值。
这一切,显然得建立在大模型足够适应领域的基础上。这里有三点,也就必不可少:
技术驱动:强大的计算能力和高效的算法是基础,大模型不是一成不变的,从问世至今,厂商也在做不断的技术加码,通过创新优化来提高性能和效率,满足场景的应用需求。
数据驱动:数据资源是大模型的立身之本。可以说,没有大量的、高质量的领域数据来进行训练、验证和调优等工作,就没办法保证大模型的准确性、决策效果、泛化能力等等。
领域知识驱动:面向特定领域,了解行业的专业知识、规则是最基本的,大模型也不例外。要结合专业内容和经验,要理解行业运营规律和特点,看企业需要什么,就构建怎样的知识图谱体系。
简单来说,市面上大部分大模型更像是基础设施,而技术驱动更侧重模型本身发展,看这个设施牢不牢固、生产力够不够强大,需不需要扩建等。
要落地领域,则更注重数据和领域知识双驱动,要厘清数据、领域知识与企业本身的内生关系,看怎样落地更具有普适性,更安全、更便捷,同时又能实现成本控制。
领域认知智能是大势所趋。
在这里,如果将“领域认知”和“智能”拆分,前者代表领域知识图谱的知识驱动,后者表示大模型的数据驱动,再加上技术本身的创新、迭代能力,共同强化面向特定领域的理解、推理、归纳等认知能力。
这样的大模型,才是领域内企业孜孜以求的。
03 领域落地核心:行业化+产品化
那么经过综上筛选,能站上领域认知智能发展风口的厂商还有多少?
不会太多,爱数是其中之一,以“行业化+产品化”核心理念积极投入领域认知智能的创新。
- 行业化层
爱数作为数据服务行业的“领航者”,从2010年就开始探索大数据基础设施,实现了从0到1的创新。可以说,它抓住了包括结构化数据、非结构化数据、机器数据等在内的所有数据入口迭代进化。
而有了全域数据能力入口,无论是从领域数据驱动来说,还是从领域知识驱动来说,都有了坚实的地基和卓越成长的可能。
以最新推出AnyDATA Framework 3领域认知智能框架为例,集成知识网络工作台、认知应用工作台和认知应用工厂三大领域落地“利器”,来构建丰富、准确、合规的知识支撑,以及便于快速整合开发环境和生态。
将这些创新优势落到企业身上,就是切实可见的效果,比如保证了领域输出的准确性和可解释性、数据知识化和业务智能化开发成本的下降、一站式认知应用的便捷搭建和领域知识使用门槛的降低等等。
再说开放性,AnyDATA Framework 3内核框架Kweaver是开源的,自带大模型工具、知识网络构建工具以及认知应用开发工具等等,对企业基于AnyDATA Framework 3的开发也好,基于Kweaver的开发也好,都十分友好。
- 产品化层
企业知识数据管理需求不断扩容,特别在大模型技术驱动下,爱数的产品体系也在不断丰富、优化,主动向领域认知智能创新靠拢,“Data+AI”打底,产品全面智能化升级。
最典型的如2023年推出AnyBackup Family 8,应对多云时代的复杂数据管理挑战,像是海量数据增长、应用迭代焕新、更严苛的合规要求等等。
产品层级上,它不再停留在数据保护这一项,而是纵深发展,形成面向业务的统一数据管理平台;能力上,拥有了备份数据湖、开放架构等多项增益,轻松完成不同业务的数据生命周期管理,整体提高企业数字化韧性。
如果是要提升传统内容的管理能力呢?
AnyShare Family 7不失为一个极佳选择。过去,知识管理、数据洞察等多依赖人工,数据量越大,效率越低、效果越差。如今AnyShare Family 7充分挖掘非结构化数据价值,将管理、查找、审查的智能化水平十倍百倍地拉高,成本降下来,还释放了生产力。
除此之外,论数据高效、标准化,AnyFabric基于领域认知智能和Data Fabric实现架构创新,业务和数据更标准,找数、用数更便捷,小成本实现一体化数据运营;AnyRobot则主攻数据割裂、闭环割裂等,突破传统技术界限,面向多云环境建立可观测性,运维运营一体化,业务更敏捷、高效排障。
总而言之,爱数对领域认知智能的创新是全维度的,有大的方面也有小的细节。要立足企业需求,做到产品既可耦合又能拆分,要每一项领域认知智能的挑战,都能在爱数找到相应的产品或解决方案。
04 与客户共创同频
回头再看企业的态度。据机构调查,除了一小部分企业基于开源自研,国内绝大多数企业用户都在等大模型的商业化落地。
但这绝大多数企业中,持观望态度的远超实际采购的。特别对领域企业而言,大模型的私域智能化够不够、知识图谱体系完善与否、有没有同一领域的落地标杆案例……都是需要关心的。
在这一层上,爱数也很早意识到,并在巡展北京站上做了技术、产品和解决方案的全方位展示,以及实际案例应用的解析。
比如,爱数与北京航空航天大学合作。通过引入AnyShare打造的北航云盘,累计成功运行近4年,实现内嵌便捷管理访问、一键收发作业、远程在线考试等多项实用功能,总计服务北航师生超9万、累计存管文件数达7000万。就在今年,北航云盘再次迎来大版本升级,全新的AnyShare Family 7加入,使云盘存算分离,容量升级至1000TB。
此外,在与北京紧密相连的天津,爱数同样冲在各领域转型升级第一线,与中新天津生态城、中国天辰、天津银行、南开大学、天津市儿童医院等建立广泛合作关系。
爱数AnyDATA认知智能框架走进中国天辰,充分汇聚、整合化工行业生产原料数据、生产工艺知识和专家经验等,打破外部科技与内部知识体系屏障,促进全链条协同创新、数字化运营和作业;与中新天津生态城开展战略合作,爱数深度参与生态城智慧城市建设、产业大脑项目,以AnyDATA知识网络工作台、AnyDATA认知应用工作台协助打造产业图谱、政策图谱等,让认知智能融入智慧城市兴业、善政等宏观布局。
与客户共创数据驱动型组织,爱数要做的是将业务场景、行业知识与全域数据能力及领域认知智能技术结合,根据客户需求解决问题。
这是爱数的承诺,也是数十年发展沉淀的实力。
可以预见,爱数的未来是无限风光,也是积极求索。在领域认知智能征途上,会有越来越多的伙伴加入,共赴领域深处,共同打造智慧世界。