IBM公司軟體集團計劃公佈發佈DB2 Information Integrator。俱了解,該産品能夠搜索HTML資料,也能搜索企業IT系統中的結構化和非結構化資料,其中包括Word、Excel、PDF文檔和日程表資料。自6月份開始IBM公司此前曾表示,它將在第四季度發信該産品。
IBM公司軟體集團的官員曾表示,真正有效的企業搜索引擎需要能夠同時處理結構化資料庫行、列中的資訊以及臺式機應用軟體中大量的自由格式資料。與基於Web的文檔不同的是,這些內部文檔通常不會被放到互聯網上,因此Google的相關度演算法搜索引擎對此無能爲力。
Google的一名發言人表示,他們的搜索技術能夠對12種主要的文件格式進行搜索,其中包括HTML、PDF以及Office使用的文件格式。