让沉默数据“开口说话” - Neo4j图数据平台的“巧思善工”
发布于 2 年前 作者 jennifer 510 次浏览 来自 分享

作者:路沙 来源:信息主管网

随着万物互联时代的到来,企业对于数据价值的期望越来越高,这也催生了数据库的变革和创新。在这一过程中,图数据库凭借更高效、更快速的实时查询和分析能力,以及更简单、更灵活的数据建模能力,正在逐渐成为企业变现数据价值,提升业务运营效率的重要手段。

Gartner 最新报告预测,随着对数据隐性关联实时洞察日益增长的需求,到2023年全球30%的企业都将使用图技术来支撑其智能商业决策。Neo4j图数据科学产品管理高级总监 Alicia Frame表示,不同于关系型数据库,图数据库以事物的连接为中心,强调数据之间的关联关系,能够让分析者从更多维度观察、分析及洞察数据,使得数据分析效率更高。

身处其中,面对不断增长的用户需求,Neo4j不仅创造了图数据库的类别,还通过整合数据科学、人工智能,机器学习等技术,充实并扩大了解决方案的功能,构建了第一个企业级的图数据平台。在Alicia Frame看来,Neo4j之所以成为图数据库领域的引领者,是因为构建了大规模可应用的产品体系,让用户能够简单易用地扩展自身应用。与此同时,通过开发社区及企业版产品,不断在开源社区推广图数据概念,在满足客户需求的同时,提升了品牌影响力。

让客户体验简单化

“Neo4j作为一个单一、简单且直观的图数据科学平台,能够支持不同的API接口、警告和错误消除功能,以及标准语法。最主要的是依托这一平台能够整合数据路径、连接,以及不同流程,使得用户能够专注于深化算法,从而大大减少应用开发所需的代码量。”Alicia Frame如此说道。

Neo4j的产品组合包括了图数据库、图数据科学、云托管服务,以及Bloom展示平台等。由此来看,Neo4j的产品体系是全面的,能够针对不同的用户需求而设计。“对于企业版客户,我们拥有世界一流的售前工程团队,通过与客户密切合作,了解业务需求,能够创建业务模型和验证项目;对于开发人员,Neo4j的产品符合ACID事务数据库,专为扩展架构而构建。而从数据源连接器和语言驱动程序上,还支持Kafka等开源平台,以及Java、Go、Javascript等语言;对于数据科学家,Neo4j能够支持多种图数据算法,使用原生Python客户端,并通过Bloom向最终客户展示全新应用成果等。”Alicia Frame进一步说道。

基于在技术创新和市场应用方面的深厚积累,使得Neo4j可以针对不同客户的需求提供不同的解决方案。事实上,其中目的在于Neo4j依托图数据科学,致力于让用户在不用代码或者用少量代码的基础上,就能轻松应用Neo4j图算法解决自身的业务问题,从而降低用户进入的门槛,加速业务变革的进程。

目前,Neo4j图数据科学提供了包括路径发现、中心度、社区检测、监督机器学习、链接预测、相似度在内的五大类超过60种算法。Alicia Frame表示,Neo4j图算法支持高度并行处理,并已在数百亿个节点上进行测试,确保算法能够完成并提供正确且易使用的答案,从而帮助企业获得全面的预测功能及处理能力。

为了实现这样一个目的,Neo4j还与Python以及主流的数据仓库产品做了深入连接。总而言之,就是要把整个用户的体验简单化,从而让更多的用户应用到Neo4j的图数据平台,并且从中受益。在Alicia Frame的设想中,用户可以根据需要选择Neo4j任意一个图算法,然后再选择数据的节点和关系,最终的应用效果能够在Neo4j Bloom展示平台中以不同颜色和标签的形式呈现出来,使得用户操作简单易用,结果一目了然。

让关联数据“自己说话”

众所周知,Neo4j图数据平台更强调数据之间的关联关系,能够结合现有数据中的关系和网络结构的预测能力,解答之前难以解决的问题并提高预测的准确性。在这一过程中,大多数的Neo4j用户都是从知识图谱开始,进而了解他们拥有哪些信息,以及信息与业务之间的关联性。

Alicia Frame表示,知识图谱就是通过一个大规模的图,将不同的数据整合连接在一起,通过分析关系以及数据关联得到新的答案,最终让关联数据“自己开口说话”。例如,将企业的基础设施、产品架构等不同维度的数据整合到一个位置,就能让最终用户拥有一个连接点,不同的连接点串联起来就形成了一张网,这样就使得数据间的关联关系更为紧密。而透过关联数据分析,能够实现业务问题的综合化,从而让复杂的问题简单化,使得用户能够更加深入地了解客户、产品,以及业务流程等信息,进而优化决策,提升运营效率。

以一家大型全球制药公司的实践为例,该企业从药物研发、生产,到临床实验、销售,以及效果反馈等,拥有一个庞大且复杂的流程。为了更好地适应市场变化以及客户需求,Neo4j为其提供了预测建模的服务,通过将病人体检、药物配置、检验检测等不同部门、不同流程的数据整合到知识图谱当中,依托Neo4j的图算法,能够有效预测哪些病人将从新的药物中受益,然后知道成为药物受益者的图模式是什么样的。基于此,他们可以找到具有相似特征的患者,并进行早期干预以改善患者疗效。

据了解,Neo4j图数据科学分为知识图谱、图数据分析、图数据特征工程、图嵌入和图神经元网络五大发展阶段。“不同的发展阶段,客户面临的难点和障碍也不尽相同。由于图数据库的框架模式不同于传统的关系型数据库,因此如何快速有效的将数据导入到图数据库当中,就是客户首要面临的问题。而成功导入数据之后,如何通过数据建模,构建有效的知识图谱,然后借助知识图谱又如何提出与业务关联性更高、价值更大的问题,并将其转化为准确的预测,则是客户面临的更为深层次的问题。”Alicia Frame如此说道。

为了更好地解决客户在不同应用阶段所面临的难点和问题,Neo4j一是推出了简捷易用的产品界面,能够帮助客户快速导入数据,构建数据模型;二是增加了与不同解决方案的连接,能够实现数据的无缝迁移;三是提供了伸缩性探索性的分析能力,以及平台展示能力;四是通过开放数据算法以及场景应用,使得其他社区开源人员能够了解在某些具体场景,Neo4j是如何应用及部署的,从而对整个行业起到教育性意义。

通用化和场景化 Neo4j兼收并蓄

Alicia Frame提到,Neo4j丰富的产品组合能够针对不同的客户需求提供不同的解决方案。不过,这并不代表Neo4j会针对某个特殊的应用场景提供定制化服务。“我们的方向是将Neo4j打造成一个通用的图数据平台,并坚持把这一通用平台做的更好更深。无论什么行业、什么企业,或者什么应用场景,都能通过Neo4j的通用平台解决自身的业务问题。”Alicia Frame如此说道。

然而,通用的图数据平台在满足大多数客户需求的情况下,是不是会丢失那些具有特殊需求的客户呢?面对这样的疑问,Neo4j有着自身独到的见解和一套实践方法论。举例来讲,在供应链分析场景中,Neo4j会为制造企业或者供应链公司提供相适应的查询语言或者算法。而在金融的反欺诈场景当中,Neo4j则会利用社区检测算法。

由此来看,针对不同的应用场景,Neo4j会为客户提供相匹配的算法,以解决特殊性需求。对此,Alicia Frame进一步提到,Neo4j取得客户认可,不仅需要自身的技术创新,还需要与合作伙伴的紧密配合。

以中国市场为例,Neo4j大中华区总经理方俊强表示,无论是从市场规模,还是业务场景来看,中国市场对于图数据平台的需求都将是巨大的。因此,2020年底,Neo4j就决定在中国投入更多的资源。在这一过程中,透过与更多企业的紧密合作,能够帮助Neo4j快速实现产品的本地化落地。因为只有本地的开源人员,本地的合作伙伴才能更好地满足本地客户的需求。

目前,Neo4j在大中华区市场已经拥有了13个合作伙伴。在Alicia Frame看来,本地化的合作伙伴能够借助Neo4j的通用平台,针对某个行业、某个项目,以及某个场景,提供深入化、定制化的服务。“我们先把Neo4j图数据平台打造成一个通用品牌,然后通过与不同合作伙伴、不同开源社区的合作,在我们的平台之上构建不同的解决方案,从而提升场景化能力。”Alicia Frame进一步说道。

笔者认为,Neo4j通过“平台使能”,使得Neo4j与合作伙伴更紧密的结合在一起,能够更快、更好、更智能地打造场景化解决方案。而“场景创新”则通过Neo4j对合作伙伴的开发支持和验证,帮助解决方案更好地落地。再加上对客户需求的深度挖掘,以及全局推进,Neo4j、合作伙伴以及客户被紧密联系在一起,形成了利益共生下的三方共赢关系,从而快速提升Neo4j图数据平台的市场影响力。

Neo4j图数据科学产品管理高级总监 Alicia Frame

Alicia Frame.png

Neo4j 大中华区总经理 方俊强 Robin (Neo4j).jpg

回到顶部