Combien de livres ont été publiés dans le monde depuis l'invention de l'imprimerie? Quelle est la taille du savoir écrit produit par l'humanité? Selon les algorithmes de Google, la réponse est proche de 130 millions, soit exactement 129.864.880, explique le site américain Mashable. Google reconnaît qu'il est en fait pratiquement impossible de faire le compte de tous les livres jamais écrits. Certains ont disparu à jamais comme dans l'incendie de la bibliothèque d'Alexandrie. Mais Google Books, qui s'est fixé pour tâche colossale et controversée de cataloguer l'ensemble du savoir écrit de la planète, a besoin d'une estimation même relativement imprécise de la tâche à accomplir et du nombre d'ouvrages à scanner et numériser. Dans un post, l'ingénieur Leonid Taycher explique la difficulté d'une telle évaluation à commencer par savoir ce qui est un livre et ce qui n'en est pas un. Google a finalement décidé de le définir par un certain volume écrit. «L'une des définitions du livre qui nous a aidé est celle d'un tome, un volume idéal. Un tome peut avoir des millions de copies ou seulement exister à un ou deux exemplaires». Google admet que cette définition est imparfaite mais elle est utilisable et similaire à la norme ISBN, ou «International Standard Book Numbers» (nombre standard international du livre). Cette norme qui vise à identifier les livres et éviter les plagiats existe seulement depuis trois à quatre décennies et uniquement dans le monde occidental. Elle ne peut donc servir de seule référence à Google Books qui a multiplié les accords dans le monde avec les librairies pour scanner le plus grand nombre d'ouvrages et a collecté plus de 150 sources de données sur les livres existants: des catalogues, la Librairie du Congrès américain, Worldcat (un réseau qui regroupe plus de 10.000 librairies dans le monde) etc. Il existerait en fait un milliard de livres différents répertoriés dans les librairies de la planète, mais les algorithmes de Google conçus pour détecter les doublons, ont ramené ce nombre à 210 millions d'ouvrages uniques. Ce nombre a été ensuite à nouveau réduit en tenant compte des millions de microfiches, enregistrements sonores, cartes, vidéos... pour arriver à 146 millions. Enfin, Google books a soustrait les publications gouvernementales et administratives pour parvenir à un peu moins de 130 millions de «vrais» livres représentant le savoir écrit de l'humanité. Bien sûr, ce nombre change constamment au fur et à mesure des nouvelles publications.