Чтобы понять, почему ChatGPT не может заменить Google Поиск, важно понять ранние дни поисковиков в интернете и ту роль, которую играл PageRank. Об этом пишет Маргарет Митчелл, междисциплинарный исследователь, сосредоточенный на формировании искусственного интеллекта.
До появления PageRank поиск выдавал множество сайтов разной полезности, качества и достоверности. Результаты поиска напрямую зависели от соответствия между тем, что вы запрашивали, и текстом на страницах. Запрос на веб-поиск (примерно) означал введение последовательности текста в качестве запроса и получение в ответ сайтов с наиболее вероятными последовательностями текста, следующими за вашим запросом.
Митчелл говорит, что это похоже на то, что мы имеем на данный момент, когда используем ChatGPT.
Но с внедрением PageRank произошел фундаментальный прорыв в поисковых технологиях. С помощью PageRank тот факт, что сайты ссылаются друг на друга, можно использовать для определения того, какие сайты являются наиболее связанными. “Сайты, на которые ссылаются больше всего, обычно нужны людям”, – пишет Митчелл.
Этот прорыв был основан на прослеживаемости информации в Интернете: связь между источниками и их содержанием: “но с ChatGPT эта прослеживаемость стирается”.
Связи между сайтами, которые были основой для поиска (в некоторой степени) достоверной информации в Интернете, удалены. “Грубо говоря, это означает, что ChatGPT находится на стадии, схожей с ранними днями веб-поиска: да, он может дать много информации, но нет большого соответствия между тем, что вы хотите, и полезными или надежными результатами”.
Скорее всего, мы придем к тому, что появится приложение ChatSearch, предоставляющее “разумную” информацию. Но это потребует фундаментальных изменений в том, как мы обучаем модели нейросетей, подобные ChatGPT.