OpenAI придумали тест на гугление для нейронок
✏️OpenAI выпустила тест BrowseComp, чтобы проверить, насколько хорошо ИИ умеет шарить в интернете.
В чём суть теста?
Там 1266 вопросов, которые требуют не просто знать, а ещё и думать головой (ну, или нейросетями) и собирать инфу с разных сайтов.🧠
GPT-4o без поиска набрал 0,6% точности. OpenAI Deep Research после теста показала - 51,5%. Но это доказывает, что ИИ нужно не только искать, но и думать, чтобы найти нужное.🤔