IBM公司软件集团计划公布发布DB2 Information Integrator。俱了解,该産品能够搜索HTML数据,也能搜索企业IT系统中的结构化和非结构化数据,其中包括Word、Excel、PDF文档和日程表数据。自6月份开始IBM公司此前曾表示,它将在第四季度发信该産品。
IBM公司软件集团的官员曾表示,真正有效的企业搜索引擎需要能够同时处理结构化数据库行、列中的信息以及台式机应用软件中大量的自由格式数据。与基于Web的文档不同的是,这些内部文档通常不会被放到互联网上,因此Google的相关度算法搜索引擎对此无能爲力。
Google的一名发言人表示,他们的搜索技术能够对12种主要的文件格式进行搜索,其中包括HTML、PDF以及Office使用的文件格式。