设为首页
繁體中文
收藏本站
会员登录
会员注册
    环球资讯网 > IT > 人工智能与大数据:Elsevier从出版商到科技公司的惊人数字化转型

人工智能与大数据:Elsevier从出版商到科技公司的惊人数字化转型

发布时间:2018-6-14   阅读:749052 次

Elsevier是世界领先的科学和医疗信息出版商之一。虽然最着名的出版商如“柳叶刀”和Cell等主要期刊,但近年来业务发生了彻底转变,将自己定位为医疗,学术和科学界的分析工具和平台提供商。

通过利用大数据和机器学习构建先进的分析系统,公司在其140年的历史中整理和发布的大量数据之上,实现了这一目标。

传统上科学或学术研究会涉及纸质出版物和书籍,使用索引来希望找到相关信息。随着互联网日益成为日常生活的一部分,随着文学的广泛数字化,将这一过程转变为数字体验的第一阶段已经实现。

搜索引擎和元数据简化了每年在Elsevier出版物中出现的超过400,000篇文章的搜索过程。在业务中,这被认为是公司正在进行的数字化转型的第一阶段。

现在,随着全球信息量以指数速度增长,第二阶段正在顺利进行。首席技术官Dan Olley向我介绍了适应研究人员,临床医生和教育工作者在数字时代寻找信息的新方法的持续任务。

“问题是我们正在接近信息超载,”他告诉我。

“我们都得到了太多的信息 - 我们面临的挑战是如何将这些信息提炼成真正重要的信息,在适当的位置获得正确的知识点,并将事实与不太准确的事实区分开来。”

信息过载当然不是Elsevier的客户或整个更广泛的学术和科学界所特有的问题。据估计,世界上的数据总量每两年翻一番。到2020年,现有的信息量将达到45 ZBT,即45万亿GB,这是人脑可以理解的。如果所有这些信息都存储在具有128GB内存的iPad上,那么您将能够从地球到月球建立一个堆栈 - 六次。

所以现在的问题很少是缺乏信息。在适当的时间找到正确的信息,并以适合研究人员和科学家日常工作方式的方式访问这些信息的可能性更大。

Olley说:“我相信我们需要在适当的时候为我们的客户提供他们需要的知识,而不仅仅是一大堆内容。

“这就是分析为我们带来的方式 - 我们如何向人们提供他们需要的信息来帮助他们做出最佳决策?要真正帮助临床医生提高生活质量,帮助科学家取得突破,而不仅仅是让他们阅读。“

有价值的是,如果信息被锁定在只有人类可以阅读的形式 - 期刊,出版物,文件,图表和照片。这类信息被称为非结构化数据 - 因为它并不适合传统计算机分析软件需要能够处理数据的行和列。因此,它只能被人们快速阅读才能处理。

这就是机器学习的地方。机器学习是人工智能算法中当前前沿的术语 - 计算机软件被设计用来在数据处理方面变得越来越高效,因为它以与人类一样的方式“学习”。

“机器学习对我们来说有什么作用可以解开开始处理这些非结构化数据的能力,并开始从中获得见解。

“我们可以使用机器学习以”传统“自然语言处理所难以做到的方式从文档中提取信息和见解。当你想到图像和其他视觉数据时,这更加真实“

Elsevier为这项革命性技术所发现的首批应用之一是通过研究人类如何使用其现有系统来解决一个它意识到的简单问题。

研究人员输入的搜索条件分析发现,他们通常以流程图的形式查找信息。幸运的是图像识别 - 有时被称为计算机视觉,因为它试图让计算机以与人类相同的方式“看到” - 在这里立即有用。

通过训练机器学习算法来梳理成千上万份研究论文和文章,并且越来越善于决定图像何时构成流程图,而不是条形图,饼图或照片 - 它可以开始更精确地返回结果匹配人类研究人员正在寻找的东西。

当它这样做时,它也开始对它遇到的其他图像进行分类。而不是仅仅拒绝照片“不是流程图”,因此不是必需的,它越来越擅长对各种图像进行分类和标注。因此,当下一位人类研究人员查找照片时,数据已经在系统中进行了标记。

与手动执行此项工作相比,使用机器学习节省了数十人年的工作量。“我们在几个月内得到了这个东西,这是一个非常有用的功能,”Olley说。

技术类似于亚马逊或Netflix用户熟悉的“推荐引擎”中使用的技术 - “如果你喜欢这个,你可能也会喜欢这样的......”对于学术和科学研究人员同样有用。非常如此,Elsevier将其构建到其诸如ScienceDirect平台的服务中。

这意味着ScienceDirect能够根据他们与我们工具的所有交互情况计算出他感兴趣的内容,然后推荐其他可能相关的研究,即使这些研究来自完全不同的学科。Olley说:“我们基本上在研究别人正在研究什么,并推荐其他对他们有帮助的事情 - 我们可以说'这里有三篇文章,甚至是三段文字或图片,这些文章刚刚发布,我们认为与你的研究非常相关。'“

从那里开始,下一个挑战就是在Elsevier自己的业务中采用相同的方法。

“有趣的是,一旦你开始熟练掌握这些东西,你就会意识到有多少机会,”奥利说。

“所以,我们将这种技术应用到我们的产品中,针对护士,医生,学术研究人员以及制药公司等大公司的研究人员。但我们也意识到我们可以在自己的操作流程中使用它。“

为了做到这一点,Elsevier不得不成为一家技术公司,并开始针对其问题开发技术解决方案,其方式是让谷歌,亚马逊和Facebook等技术领域的领先企业成为其领域的主人。

“我的观点是,当我们在10年内查看组织时,公司中的每个部门都会有一个分析团队。我认为组织从“卓越分析中心”这样的事情开始,但我不认为这是结束的地方,对于那些真正了解他们正在努力解决的问题的人来说,这应该是一种无处不在的技能。

“看看我们现在的位置 - 你可以从亚马逊,微软或谷歌获得机器学习服务。技术不是问题,而是数据。

“首先查看你的数据,找出你需要解决的问题,并找出解决这些问题所需的数据。今天,数据正在成为商业世界的真正货币。“

Elsevier采用了一种可能会越来越普遍的模式,因为我们看到以旧世界技术和数据系统为基础的企业转向数字驱动型组织。

越来越多的业务的每个方面都在变成数据驱动,并且将正确的工具和系统转换成能够将大量知识转化为动力 - 可操作的见解 - 是成功实现数字化转型的关键。

奥利先生的最后一笔智慧,我当然认为它非常有价值 - “不要觉得你必须马上解决100%的问题。如果你想解决一个问题,那么如果你的机器学习算法能解决一半问题,那么就好了,你仍然需要将一半的问题发送给人类。“

“你仍然解决了一半的问题,随着时间的推移,正确的反馈循环,你会解决另一半,但你不必在第一天就这样做。这些解决方案将随着您的训练而不断增长和发展,并且不会取代人类智能。“


CopyRight© 2011-2015 zgqynews.com All Rights Reserved   环球资讯网  版权所有

服务热线: 18611682146 18612878329  13718459036   QQ:2754868060 QQ:2563761688

备案号:京ICP备1300688