По данным издания The Information, OpenAI, в которую инвестирует Microsoft, использует результаты поиска Google, хотя прямого доступа к ним не имеет. Для этого применяется сервис SerpApi — платформа, которая собирает поисковую выдачу с помощью веб-скрейпинга.
Эти данные помогают ChatGPT отвечать на вопросы о текущих событиях, например о спортивных результатах или колебаниях на бирже. Год назад OpenAI напрямую запросила доступ к поиску Google, но получила отказ. С тех пор Google пытается усложнить работу SerpApi, хотя не подаёт в суд, чтобы не усугублять своё антимонопольное разбирательство в США.
Помимо SerpApi, OpenAI использует собственный веб-сканер, а также данные от Microsoft Bing и других компаний. Однако по признанию самой OpenAI, этих источников пока недостаточно, чтобы достичь точности Google, особенно в случае редких запросов.
Разработчики также заметили, что иногда ответы ChatGPT выглядят как готовые фрагменты из поисковой выдачи Google. В одном из экспериментов бывший инженер Google создал поддельные страницы, которые индексировались только в Google. Несмотря на это, ChatGPT смог отобразить их в ответах, что указывает на использование информации именно оттуда.