Diffbot : L'extraction de données web par l'IA
Diffbot est une solution innovante pour l'extraction de données web. Il permet à votre application d'accéder au web comme à une base de données structurée. Il propose plusieurs types de données, tels que les organisations, les actualités et articles, les produits de vente au détail, les discussions et les événements.
Dans la catégorie des organisations, il fournit plus de 50 champs de données, comprenant les catégories, les revenus, les emplacements et les investissements. Avec plus de 246 millions d'entreprises et d'organisations à but non lucratif dans le Knowledge Graph, vous pouvez extraire et actualiser les informations sur demande.
Pour les actualités et articles, il offre plus que du simple texte, avec la correspondance d'entités et l'analyse du sentiment au niveau des sujets. Il y a plus de 1,6 milliard d'articles de nouvelles, de blogs et de communiqués de presse dans le Knowledge Graph, que vous pouvez extraire à votre guise.
Les produits de vente au détail comportent plus de 20 champs de données, y compris la marque, les images, les critiques, les offres et les prix de vente. Avec plus de 3 millions de produits pré-araignés dans le Knowledge Graph, vous pouvez également extraire ces produits sur demande.
Les discussions sont un type de données unique, permettant d'accéder aux informations dans les forums et les critiques. Encore une fois, il y a plus que du simple texte, avec la correspondance d'entités et l'analyse du sentiment au niveau des sujets.
Les événements sont dotés de descriptions complètes et de dates et heures de début et de fin normalisées. Il y a plus de 23 000 événements dans le Knowledge Graph, que vous pouvez extraire selon vos besoins.
En somme, Diffbot transforme le web en données utilisables, en lisant et en comprenant le contenu de manière similaire à un humain.