Исследователи создали модель искусственного интеллекта с открытым исходным кодом, которая превосходит классические большие языковые модели в синтезе больших объИсследователи создали модель искусственного интеллекта с открытым исходным кодом, которая превосходит классические большие языковые модели в синтезе больших объ

ИИ с открытым кодом OpenScholar бросил вызов ученым в анализе научной литературы

3м. чтение

Исследователи создали модель искусственного интеллекта с открытым исходным кодом, которая превосходит классические большие языковые модели в синтезе больших объемов научных публикаций и цитирует источники так же точно, а в некоторых случаях даже лучше, чем эксперты-люди. Система, получившая название OpenScholar, основывает свои ответы непосредственно на научной литературе, что минимизирует риск «галлюцинаций» — генерации ложной или недостоверной информации. Таким образом, модель может стать более производительным и доступным инструментом для студентов и ученых, выполняющих обзор научной литературы.

Синтез и мониторинг научной литературы являются ключевыми для исследовательской работы, включая поиск новых направлений, уточнение методологий и подкрепление результатов доказательствами. Однако стремительный рост числа публикаций делает эти процессы все более трудными для ученых. Большие языковые модели могли бы помочь благодаря своей способности обрабатывать большие массивы данных, но они часто склонны к галлюцинациям, а их обучающие данные не являются сугубо научными, что может приводить к ошибкам. Эти модели генерируют ответы, основываясь на наиболее вероятных языковых ассоциациях, даже если они не всегда релевантны или актуальны, поэтому цитируемые ими ссылки не всегда существуют или уместны.

OpenScholar предлагает решение большинства этих проблем, оставаясь полностью открытой. Исследователи могут свободно испытать её на специальном сайте или интегрировать в собственные системы, используя методику, описанную в недавней статье в журнале Nature. В отличие от моделей, обученных на разнородных данных, OpenScholar специализируется на работе с базой из 45 миллионов статей открытого доступа, оптимизированной для таких областей, как биомедицина, информатика и физика. Когда пользователь задает вопрос, система находит в этой базе релевантные статьи, ранжирует их по степени соответствия и формирует ответ, основываясь исключительно на самых подходящих из них. Этот процесс, оптимизированный под научную литературу, и призван ограничить галлюцинации. Модель работает по принципу постоянного уточнения: она генерирует первоначальный ответ, а затем при необходимости последовательно его улучшает.

Команда разработчиков протестировала OpenScholar, сравнив ее способность отвечать на научные вопросы с возможностями других популярных языковых моделей. Вопросы, охватывающие информатику, физику, нейронауки и биомедицину, были составлены экспертами уровня PhD. В результате OpenScholar дала правильные ответы на 51% вопросов по информатике, тогда как показатель GPT-4o составил 45%. Она также превзошла модель Llama от Meta* и конкурентные инструменты, такие как PaperQA2 от FutureHouse, в оценках точности цитирования и фактов. Человеческие оценщики, включавшие 12 аспирантов и постдокторантов, в 51% случаев предпочли ответы OpenScholar ответам других экспертов-людей, а при сравнении с GPT-4o этот показатель достиг 70%.

В то же время эксперты отмечают сложность объективной оценки, так как даже в рамках одной дисциплины мнения о наиболее уместной цитате для подтверждения аргумента могут сильно расходиться. Существуют у инструмента и практические ограничения: он не имеет доступа к платным статьям, что может снижать его полезность в таких областях, как инженерия или социальные науки, где открытые препринты менее распространены. Авторы исследования планируют дальнейшее развитие модели, нацеленное на повышение ее гибкости и возможность работы со статьями, доступными пользователям по подписке или загруженным локально.

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

НКС и НДЗД подписали меморандум о взаимопонимании для усиления защиты данных и конфиденциальности в сфере телекоммуникаций

НКС и НДЗД подписали меморандум о взаимопонимании для усиления защиты данных и конфиденциальности в сфере телекоммуникаций

Нигерийская комиссия по коммуникациям (NCC) подтвердила свою приверженность конфиденциальности и защите данных в нигерийской телекоммуникационной отрасли… Публикация NCC, NDPC подписывают меморандум о взаимопонимании для
Поделиться
Technext2026/02/06 19:30
Фонд психического здоровья пожарных Ванкувера будет принимать Биткоин

Фонд психического здоровья пожарных Ванкувера будет принимать Биткоин

Пост о том, что фонд психического здоровья пожарных Ванкувера будет принимать Биткоин, появился на BitcoinEthereumNews.com. Мэр Ванкувера Кен Сим запустил фонд, предназначенный для поддержки психического здоровья пожарных. Согласно новым данным, фонд, которым управляет благотворительная организация пожарных Ванкувера, будет принимать как денежные пожертвования, так и цифровые активы, в частности Биткоин. В заявлении, опубликованном офисом мэра, говорится, что это решение основано на данных Канадской ассоциации психического здоровья, которые показывают, что уровень самоубийств среди пожарных на 30% выше, чем среди населения в целом, из-за травм, с которыми они сталкиваются на работе. "На сегодняшний день доноры пообещали в общей сложности 3,5 биткоина в фонд, что эквивалентно примерно 550 000 канадских долларов", - говорится в заявлении офиса мэра. Мэр Ванкувера запускает фонд психического здоровья пожарных Изначально благотворительная организация пожарных Ванкувера собрала около 2,7 миллиона канадских долларов на прошлой неделе во время сбора средств. Именно во время этого мероприятия Сим объявил о создании фонда, объяснив аудитории, как он поможет пострадавшим. По словам представителей офиса мэра, обещанные средства будут добавлены к собранным фондам, отмечая, что это значительно поможет жертвам проблем с психическим здоровьем среди пожарных Ванкувера. Эрик Химмельман, исполнительный директор благотворительной организации пожарных Ванкувера, заявил, что организация сделает все возможное для эффективного распределения средств. "Любое финансирование и повышение осведомленности, направленные на оказание большей поддержки психического здоровья пожарным, которые испытывают трудности, высоко ценятся и необходимы сейчас как никогда раньше", - добавил он. Ожидается, что отчет будет представлен персоналом этой осенью. Эта инициатива появляется в то время, когда на крипторынке наблюдается повышенная волатильность. Как ранее сообщал Cryptopolitan, Федеральная резервная система недавно объявила о первом снижении процентной ставки на 2025 год, что заставило аналитиков и экспертов предположить, что это может вызвать медвежий тренд в краткосрочной перспективе. В...
Поделиться
BitcoinEthereumNews2025/09/20 16:58
Ethereum Foundation представила панель мониторинга безопасности блокчейна

Ethereum Foundation представила панель мониторинга безопасности блокчейна

Организация Ethereum Foundation представила One Trillion Dollar Security Dashboard. Это панель для отслеживания общего уровня безопасности Ethereum, ключевых ри
Поделиться
Incrypted2026/02/06 18:54