返回列表
10月24日,在2024嘉定数字城市体验周系列活动——数据要素赋能新质生产力主题论坛上,鸿翼联合创始人兼首席技术官罗永秀带来《AI时代的数据要素:驱动创新与价值转化的新引擎》主题演讲,分享了鸿翼在非结构化数据管理与AI应用实践,为帮助组织创造最大化的数据价值以及企业大模型落地提供了宝贵的前瞻视角。
分享嘉宾|罗永秀 鸿翼联合创始人兼首席技术官
在人类社会革命发展的进程中,从某种意义而言,这是一个大规模网络构建的历程,而信息则是网络连接的黏合剂。从最初的面对面沟通传递信息,历经甲骨文、竹简,再到如今的数字信息载体,信息传递的速度日益加快。
在当下最强信息技术 —— 人工智能的时代,信息质量愈发决定着信息传播的规模与力量。从行业角度看,高质量的数据可称为知识,社会如此,企业亦如此。实际上,我们每天所接触的数据中,80%甚至更高比例是如文本、音频、视频等各种形态的非结构化数据,它们充斥在社会与企业的方方面面。
2018年我国发布了最权威的DCMM数据管理能力成熟度评估模型,随后在2021年,由工信部主导、鸿翼主要负责的非结构化数据国家标准也相继发布。我们都知道所有大模型都是通过非结构化数据训练形成,其应用背后由数据驱动,去驱动各种应用单元之间的一个连接,去驱动应用单元与人交互的一个连接。那么,如何让数据变得更有质量,是当下每一个中大型企业高度关注的系统建设方向。
近年来,数据成为驱动生产力的核心生产要素后,企业信息化、数字化建设中,非结构化数据的顶层规划愈发重要,当然建设的路径是多样的,可以从某个应用切入,也可以从平台切入,从非结构化数据中台到知识中台。
然而,非结构化数据建设面临诸多复杂挑战,包括安全、合规、效率、数据质量等问题,这些都需在建设中考虑。鸿翼专注在非结构化数据领域20余年,因为我们不仅要在数据之上建平台,还要在平台上建应用,以帮助企业应对不同方面的问题。
自疫情以来,市场环境充满挑战,中大型企业纷纷重视知识管理,这背后的原因是什么呢?对于企业,核心竞争力是产品,组织经验、能力等需要沉淀,形成一种能力的标准,这是一种不小的挑战。
对于企业而言,你的标准化有多宽,你的标准化你覆盖的这个场景有多广,就代表着企业的竞争力有多强,知识管理同样如此。执行过程就是知识的整个创建过程,业务的更新迭代也必须要伴随着知识的循环迭代;企业管理需上下结合,知识管理也一样;若企业没有知识管理文化,项目将面临挑战,这也是知识管理成为中大型企业数字化建设重要方向的原因。
纵观国内知识管理现状,中大型企业需求旺盛,组织高层重视,大模型 AI 重塑了知识管理全过程能力。那么如何让知识管理更稳健的落地和推进?首先,平台要具备强大的非结构化数据及内容管理能力,因为知识多为非结构化数据。其次,知识要随着业务变化实时更新,通过非结构化数据平台存储业务文件,把各种体系、过程、成果等各种形态的非结构化数据整理萃取,形成高质量知识数据赋能业务。
AI的应用需要与企业业务深度融合,背后必须有一个知识库,知识库的完整性和质量直接决定了AI的有效性。当前国内的Agent智能体,是否可以帮企业去解决具体的业务?这样的一个能力,从某种意义上来说,它完全取决于知识库的质量。这两年,鸿翼不仅专注在ECM 非结构化数据全生命周期管理,还包括在业务环如何让这些数据通过 AI 大模型去落地,通过双环端到端去实现大模型应用在企业内有效落地。
接下来我们讲讲全域非结构化数据治理平台与增强型CORE输送高质量大模型数据。整个内容库包括体系的内容库、过程的内容库、知识库,甚至包括档案库,然后通过RAG管道转化成大模型数据,这个大模型数据它有可能是高质量的文件数据、知识数据也可能是内容块、QA对,以满足前端各种大模型训练的需要。仅有数据、有知识还不够,还得具有很强的RAG管道工程化能力,这就是我们的ECM Core AI的能力,其核心能力包括文件内容化、内容数据化。
我们看到,非结构化数据的应用非常缺乏,有很多面向安全、面向管理、面向合规、面向用户效率的,但面向泛场景的几乎是缺失的。因此,鸿翼在 OpenContent 智能文档云V8 版本中强化了两条线能力,一是元数据驱动的文档结构化应用,借助成熟的结构化技术反哺非结构化数据管理与应用;二是基于门户组装引擎,构建以文档为主体的门户场景应用,从展示、到协作管理、再到更丰富的场景,从系统级的应用界面,到面向于人人都可以各种通过组装引擎去创建业务场景。
总而言之,我们需要更加高度重视非结构化数据平台体系规划与建设,持续实时地将这些数据转化为高价值的知识数据,以此帮助企业降本增效提质。通过高质量知识数据构建企业专属大模型,利用人工智能深度挖掘非结构化数据的潜在价值,实现文档、AI与数据的深度融合,为组织创造最大化的数据价值。
在数字化时代,内容已成为企业最宝贵的资产之一。企业在各个部门、与外部伙伴合作中产···
11月8日,由湖北省勘察设计协会主办,上海鸿翼软件技术股份有限公司承办的2024···
企业在发展的过程中,不断积累数据、知识等内容,如何令这部分内容真正地发挥其价值?···
AI、大数据和知识管理三股热潮的汇聚与融合,正以前所未有的速度推动企业知识管理向···
11月5日,智谱在北京举办“智谱大模型生态合作伙伴联盟发布会”,联合鸿翼等11家···
在数字化时代,内容已成为企业最宝贵的资产之一。企业在各个部门、与外部伙伴合作中产···
11月8日,由湖北省勘察设计协会主办,上海鸿翼软件技术股份有限公司承办的2024···
企业在发展的过程中,不断积累数据、知识等内容,如何令这部分内容真正地发挥其价值?···
AI、大数据和知识管理三股热潮的汇聚与融合,正以前所未有的速度推动企业知识管理向···
11月5日,智谱在北京举办“智谱大模型生态合作伙伴联盟发布会”,联合鸿翼等11家···