本文转载于“DataExa渊亭科技”公众号,原作者“爱分析ifenxi”

近日,渊亭科技完成了亿元B+轮融资,由重庆制造业转型升级基金、财信中金管理的长沙天心基金等国家级和地方级基金共同投资。本轮资金将主要用于核心AI产品研发、国防业务拓展和团队建设。

渊亭科技成立于2014年,在知识图谱、图计算、强化学习、机器学习(深度学习)等领域打造核心技术优势与领先的工程化能力,聚焦国防、金融、政务和工业互联网行业,提供决策中台、认知中台、数据中台三大中台产品与全栈人工智能行业解决方案。

2023年起,渊亭科技将军事大模型构建能力融入既有产品体系,以“大模型带小模型”的方式,在强敌研究、作战指挥、模拟训练等五大类型、共70多项具体场景中进行智能应用落地,成为业内首个推出军事大模型的公司。

从2022年底OpenAI发布ChatGPT开始,大模型成为AI领域的焦点。在国内市场,以互联网大厂和AI科技厂商为代表的玩家正火速布局通用大模型和行业大模型。国防作为行业大模型的重要应用方向,相关技术也正被广泛的研究。

包含大语言模型在内的各类军事预训练模型不仅能有效降低军事智能化技术的应用门槛,还能大幅强化既有信息化支撑手段,提升军事业务的质量和效率,例如实现更快速的任务规划、更精准的目标识别。然后,现实中,国防领域的大模型训练和应用,也面临着诸多问题。例如,出于数据保密要求,很难获取足够的训练样本;军事决策的严谨特点,使得用户对可解释性和准确性有着极高的要求;联合全域、多兵种融合作战的趋势下决策的复杂度极高,单纯的大模型技术很难面面俱到……

针对国防军事领域大模型落地的种种特点和难点,处于AI技术前沿的科技厂商应该如何应对?渊亭科技给出了自己的答案。

01、打造业内首个军事大模型,赋能5大类型70个场景

渊亭科技与国防领域的渊源可以追溯至2013年。彼时,渊亭科技创始团队参与某高级别国防智能项目,应用自然语言处理技术、知识图谱等级技术,处理大量武器装备信息,融合形成武器装备知识图谱,构建武器研发中的体系化知识应用。团队在客户处驻点数月,圆满完成了从概念验证、系统构建到场景应用的任务。

以此项目为契机,创始团队在2014年1月正式创办渊亭科技,开展人工智能产品研发和应用落地,以知识图谱产品和人工智能中台(MLOps)为基础,逐渐丰富面向国防、政务、金融、工业等领域的场景解决方案。

在此期间,渊亭科技结合自身的定位和特点,积极参与国内外人工智能相关标准的研讨和制定,例如,仅在2022年,渊亭就参与了《知识构建与管理》、《知识计算与应用》、《企业知识管理》、《智能决策能力评估方法》等行业标准规范的制定,并深度参与了《生成式人工智能技术及产品评估方法》的制定。另外,渊亭也是全国唯一(截止发稿时)通过工信部《可信AI:智能决策产品》的厂商。

这些积累,为渊亭科技的军事大模型解决方案打下了坚实的基础。“十四五”以来,国防智能化、无人化受到了行业极大的重视,伴随着2022年以来大模型技术的成熟度上了一个新的台阶,渊亭科技在过往军事智能化研究基础之上,加大了大模型核心技术的研发力度,探索大模型技术的落地方法,形成更为优秀的军事决策能力。

军事决策和通用领域相比,具有独特、鲜明的特点,这些给大模型技术的落地带来了巨大的挑战。

为解决这些问题,渊亭科技设计出体系完备、能力可扩展的军事认知决策平台“天机·军事大模型”。技术上,渊亭科技系统梳理了过往军事决策解决方案的典型技术手段(例如机器学习、强化学习、运筹优化、专家规则等),将其沉淀为“智能插件”后作为小模型嵌入平台,以“大模型带小模型”的方式,支撑以作战指挥为核心的各项业务。

渊亭科技在多年的防务行业实践中积累了海量军事数据,包括军事术语常识、战略条令法规、战例演训记录等,能够极大的缓解数据获取难题。其中,渊亭智库专注外军开源情报,迄今已积累了包括防务资讯、防务报告、条令法规、军事舆情、军事影像等类型数据,沉淀了超100万份高质量文档、逾300TB军事影像。基于这些,渊亭正在开展自有基础大模型的训练。在具体的项目中,渊亭科技基于基础大模型积累以及丰富的大模型训练和微调经验,结合客户额外提供的定向专业领域数据,能够快速集成、构建满足特定业务场景需求的军事基座大模型。

军事领域需要充分考虑通讯不可达性,因此以数据中心为中枢的标准大模型应用模式存在硬伤,而基于各层级指挥所或智能装备开展智能推理,又对模型的小型化、轻量化提出了较高要求。另外,在大规模应用场景下,模型的标准故障诊断、能力升级的工程复杂度较高,多计算节点协同推理这类“分布式计算”模式则是更大的挑战。针对这些问题,渊亭科技基于已在多个大型客户成熟应用的人工智能中台能力,结合大模型训练、部署和应用的特点,提供完备的模型裁剪和云雾边端部署/运维能力,能够在云端进行模型训练和能力生成,并结合使用需求进行模型的处理和下发。

为解决智能技术的不可信问题,渊亭科技致力于构建可信军事智能评估体系,秉渐进式可解释原则,最大化满足军事决策对AI可解释性的要求。知识图谱属于精确可解释的技术,渊亭科技基于其拥有亿级规模数据的数字战场图谱,在大模型训练和推理过程中附加领域知识,提升输出的可靠度;针对广泛应用于识别/预测模型训练、智能体训练的深度学习、强化学习等“黑箱”技术,在执行过程可视化的基础之上,渊亭科技还可以利用工程化方法对神经网络模型进行一定的可解释性分析,解析出关键路径、拐点动作,帮助相关人员评估可信度、开展方法研究。

“大模型带小模型”的要点,是根据业务领域选择适当的“基座大模型”后,根据场景特点,无缝、灵活的附加定向约束和增强,提升决策的准确性。以杀伤链生成过程为例,如果仅依赖常规大模型自动生成内容,生成的战斗序列极大概率存在“幻觉”,粗看像模像样,实际无法执行,如战斗机航程不足、速度超限等。具体的,渊亭科技使用知识图谱、运筹优化等技术对标准大模型进行增强。例如,利用数字战场图谱中包含的大量军事基础信息进行约束计算、确保生成方案的可执行性,利用专家经验+运筹算法,修正大模型最佳火力规划的推理结果。

目前,渊亭科技正在依托天机·军事大模型产品,打造智能防务领域八项能力,通过单独应用或能力组合,为军事领域5大类型、70多个应用场景赋能。

02、深耕国防,多行业发力

渊亭科技持续深耕AI+国防,并依托行业Know-how树立了难以复制的行业竞争壁垒。基于自主研发的多智能体强化学习、认知推理、数字孪生等技术,围绕情报应用、指挥控制、支援保障方向打造了一站式AI+国防解决方案,即“天”产品体系。

过去三年间,渊亭科技获得了军工领域相关服务资质,服务过包含军事科学院、国防科技大学、中国电科、中国兵器、航天科工、中国船舶、中国兵装等在内的众多国防单位、院所,还斩获过军委、军种级别军事对抗大赛多个冠军及三甲重要奖项。这些案例不仅证明渊亭科技在军事场景的解决方案能力,也为渊亭科技积累了深厚的行业认知,树立起行业竞争的高壁垒。

深耕于国防领域的同时,渊亭科技也在金融、政务、工业互联网等行业发力。公司构建了以智能监管、智能决策和智能运营为重点能力的政企产品体系。在公共安全、智慧城市、金融监管、投研分析、产业链分析等场景推出了行业产品与解决方案,积极推动智能化应用落地。

在这些行业,渊亭科技同样取得了优异成绩。以金融行业项目为例,2019年,渊亭科技参与了一个国家级别的金融监管项目建设,主办单位邀请数十家AI企业进行概念演示验证。由于只有三天的验证时间,不能从头开始建模、训练,这对厂商模型积累提出了很高要求。渊亭项目团队结合设定场景的特点(历史样本案例过少容易导致训练效果不佳,样本存在一定聚集的趋势),采用基于图谱的无监督分析技术,完成高频率相互交易的群体初始聚类,在此基础上进一步开展训练、分析,有效的将实际计算量控制在1小时内(其他厂商大约3~5天),且误差率只有万分之四,核心指标均排名第一。

据悉,目前渊亭科技已服务了中国银行、建设银行、中国登记结算、广发证券、中国移动、中国铁塔等200多家知名企业与政府机关,落地近千个人工智能和大数据相关应用。

03、聚集优秀人才,发展前沿技术

渊亭科技能够在各领域高效进行智能化项目落地,依赖完备的技术储备、产品储备和人才储备。

渊亭科技专注于AI技术研发与创新,联手国内顶尖高校和科研机构开展前沿技术领域研究,涵盖自动化机器学习、可视化建模训练、自动化(无监督、半监督)行业图谱构建、多智能体博弈、分布式图数据库等关键技术领域。到目前为止,渊亭科技的技术发展迅速,积累了600+(特征工程、机器学习、模型优化)智能算子、60+自研图分析推理算法和30+自研强化学习算法,为智能化项目落地提供有力保障。

产品方面,渊亭科技自主研发了DataExa-Insight人工智能中台、DataExa-Sati认知智能平台、DataExa-Seraph图数据库、DataExa-Maya智能问答引擎、DataExa-Nash多智能体协同决策平台、DataExa-Karma智能决策引擎等多款产品,能够高质量支持认知智能全栈技术研发与产品化落地,同时在可信AI、认知推理、自主学习等下一代人工智能技术有大量的研究和实践探索。

迅速发展的技术实力离不开团队的支持。渊亭科技创始团队具有深厚的工程化基因,曾负责过不少亿级大型项目,对大型复杂项目的整体架构剖析和落地有深刻理解。在渊亭科技看来,技术落地的最大难点是业务架构与技术架构的融合,而渊亭科技恰恰具备技术工程化领域的团队基因,并因此吸引了一批实干型人才。在国防领域,具备行业Know-how人才往往曾为部队服务。渊亭科技的行业口碑和能力展现,吸引了众多有志之才。军事人才和技术人才协作,形成1+1>2的合力,共同为军事智能化做出贡献。

随着国防领域软件和技术成熟度提高,越来越多的技术将跳出实验室,进入实装验证和实战演练阶段,渊亭也积极投身其中。

群体智能是渊亭科技国防智能化领域的重点发展方向之一。群体智能的一大特点是多装备结合,这不仅需要人工智能作为云端大脑,还要涉及舰船、飞机、装甲车辆等末端智能设备的能力协同。渊亭科技将基于自身的技术积累,以末端智能设备的算法小型化和跨设备协作为主要方向,推进相关的能力研发。

另外,面对高强度、快响应的指挥决策智能化领域,渊亭科技也将充分利用丰富的决策技术运用经验和平台积累,形成覆盖方案生成、任务规划、临机决策、能力快速迭代的全环节解决方案。

来源:渊亭科技