Home » Blog » Более 9 миллионов неработающих ссылок в Википедии теперь восстановлены

Более 9 миллионов неработающих ссылок в Википедии теперь восстановлены

Rate this post

теперь восстановлены В рамках цели Архива Интернета по созданию лучшего Интернета мы работаем над тем, чтобы сделать Интернет более надежным? и рады сообщить, что 9 миллионов ранее неработающих ссылок в Википедии теперь работают, поскольку они ведут к архивным версиям в Wayback Machine.

22 языковых издания Википедии с более

чем 9 миллионами ссылок теперь ведут на Wayback Machine.

На протяжении более 5 лет Архив Интернета Магазин теперь восстановлены архивирует практически все URL-адреса, упоминаемые примерно на 300 сайтах Википедии? по мере их добавления или изменения со скоростью около 20 миллионов URL-адресов в неделю.

Последние три года мы используем

программу-робота IABot в 22 языковых версиях Википедии, которая ищет неработающие ссылки (URL-адреса, возвращающие ошибку « 404 » или «Страница маркетологом в социальных сетях не найдена»). При обнаружении неработающих ссылок IABot ищет архивы в Wayback Machine и других веб-архивах для их замены. Восстановление ссылок гарантирует точность и проверяемость Википедии, что соответствует одному из трёх основных правил Википедии в отношении контента: « Проверяемость ».

На сегодняшний день мы успешно

использовали IABot для редактирования Данные Sault и исправления URL-адресов почти 6 миллионов внешних ссылок, которые в противном случае возвращали бы ошибку 404. Кроме того, участники сообщества Википедии самостоятельно исправили более 3 миллионов ссылок. Теперь более 9 миллионов URL-адресов на 22 сайтах Википедии ведут к архивным ресурсам Wayback Machine и других провайдеров веб-архивов.

(Нерабочая ссылка) (Восстановленная страница)

Один из способов оценить реальную пользу теперь восстановлены этой работы — подсчёт количества переходов из Википедии на Wayback Machine. В течение последних 10 дней Фонд Викимедиа начал измерять количество переходов по внешним ссылкам в рамках нового исследовательского проекта (совместно с группой исследователей из Стэнфорда и Федеральной политехнической школы Флориды), направленного на изучение того, как читатели Википедии используют цитаты и внешние ссылки. Предварительные результаты показывают, что, безусловно, самым популярным внешним ресурсом был Wayback Machine, в три раза опережая следующий по популярности сайт books.google.com. В реальных цифрах, в среднем, более 25 000 переходов в день из английской Википедии на Wayback Machine было сделано.

Из « Исследование: Характеристика

использования цитирования в Википедии/Первый раунд анализа »

Запуск IABot на сайте Википедии требует как технической интеграции, так и операционной поддержки, а также одобрения всех соответствующих сообществ Википедии. Над этим проектом работали два ключевых человека.

Максимилиан Дёрр  известный в

мире Википедии как «Cyberpower», давно работает волонтёром в сообществе Википедии, а в настоящее время является консультантом Архива Интернета. Он является автором программы InternetArchiveBot ( IABot ).

Стивен Балбах — давний волонтёр сообщества Википедии, сотрудничающий с Максом и Архивом Интернета. Он разработал программы для поиска и исправления ошибок в данных, проверки существующих архивов Википедии и обнаружения новых архивов среди миллиардов страниц Wayback и десятков других провайдеров веб-архивов.

Scroll to Top