Quand il y a trop de spam sur le net

Danny Sullivan des moteurs de recherche a répondu aux plaintes concernant le spam dans la recherche Google demandant à une personne d’enregistrer les déchets en utilisant le formulaire. Le consommateur a signalé et Danny a répondu que les enregistrements de courrier indésirable géniaux provoquent souvent « un saut en profondeur pour comprendre les réseaux et obtenir de larges mesures ». Il a ajouté des «courriels indésirables» pour aider. Yahoo a constamment mentionné avoir lu des rapports indésirables et nous avons observé les actions que Yahoo a menées au fil des ans sur ces enregistrements. Ainsi, même si cela peut nécessiter du temps pour que Yahoo se comporte, en particulier pour d’autres problèmes de courrier indésirable étendus, Google prend finalement des mesures. Brin et Webpage, qui se sont rencontrés en tant qu’étudiants diplômés au Stanford College, étaient fascinés par l’idée de supprimer ce que signifie la majeure partie des données accumulées sur Internet. Ils ont commencé à opérer depuis le dortoir de Page à Stanford pour développer un tout nouveau type de technologies de recherche, qu’ils ont appelé BackRub. Le véritable secret était d’influencer les capacités de positionnement des internautes en surveillant les «liens de support» de chaque site Web, c’est-à-dire la quantité d’autres pages Web qui leur sont connectées. La plupart des moteurs de recherche comme google ont simplement renvoyé une liste de sites Internet classés par le nombre de fois où une expression de recherche leur est apparue. Brin et Page incorporés dans la recherche fonctionnent sur la quantité d’hyperliens que chaque site Web a connus; c’est-à-dire qu’un site Web avec des milliers d’hyperliens serait rationnellement plus avantageux qu’un seul avec seulement quelques liens, et les principaux moteurs de recherche positionneraient ainsi le site fortement lié plus sur une liste d’opportunités. De plus, un lien hypertexte à partir d’un site Web fortement lié sera un «vote» beaucoup plus utile que celui d’un site Internet plus obscur. Au milieu de l’année 1998, Brin et Page ont commencé à recevoir un financement extérieur (parmi leurs premiers traders, Andy Bechtolsheim, cofondateur de Sunlight Microsystems, Inc.). Ils ont finalement rapporté environ 1 000 $ à des commerçants, des proches et des amis proches et se sont installés à Menlo Park, en Californie, sous le nom Moteurs de recherche, qui a été produit à partir d’une faute d’orthographe de l’authentique étiquette planifiée de Page, googol (un terme mathématique pour le principal puis 100 zéros). Au milieu de l’année 1999, lorsque les moteurs de recherche ont acquis une ronde de financement de 25 milliards de dollars de fonds de capital-risque, ils absorbaient chaque jour 500 000 problèmes. L’exercice a commencé à exploser en 2000, lorsque Google est devenu le moteur de recherche sur Internet pour les acheteurs parmi les sites Internet les plus populaires du Web, Yahoo !. En 2004, lorsque Google! dispensés des services de Google, les clients naviguaient sur les moteurs de recherche 200 millions de fois par jour. Cette évolution n’a fait que se poursuivre: fin 2011, les moteurs de recherche géraient quelque trois milliards de recherches par jour. Le label de l’entreprise est devenu si omniprésent qu’il est entré dans le lexique sous forme de verbe: les moteurs de recherche sont devenus une manifestation fréquente de la navigation sur le Web. Pour prendre en charge cette taille de données remarquable, Yahoo a développé 11 centres d’information dans le monde entier, chacun contenant un certain nombre de centaines de milliers de serveurs (généralement des ordinateurs multiprocesseurs et des disques durs montés dans des étagères spécialement conçues). Les ordinateurs interconnectés de Google s’élèvent probablement à plusieurs millions. Le cœur de la procédure de Google est néanmoins construit autour de trois bits exclusifs de code de programme informatique personnel: Yahoo File System (GFS), Bigtable et MapReduce. GFS s’occupe du stockage des données Web en «morceaux» sur un certain nombre d’équipements; Bigtable est certainement le programme de base de données de l’entreprise; et MapReduce est utilisé par Yahoo pour générer des données de plus haut niveau (par exemple, la mise en place d’une liste de pages du site Web qui contiennent l’expression «Chicago», «théâtre» et «participative»). A lire sur:

Comments are closed.