W wielu dziedzinach jest wolniejszy i udziela gorszych odpowiedzi od wcześniejszego ChataGPT 4, a do tego OpenAI ostrzega, że – jeśli jego zabezpieczenia zostaną złamane i trafi w niepowołane ręce – może być „najniebezpieczniejszym modelem”, jaki firma dotąd wypuściła. Mimo to o1 ma być przełomowy, bo „rozumuje szybciej i lepiej niż ludzie”.
ChatGPT napędzany nowym modelem językowym
Informacje dotyczące ryzyka, jakie niesie program, można traktować jak chwyt marketingowy, który OpenAI stosuje dość regularnie, ale poinformowano też, że program „przeszkolono przy użyciu zupełnie nowego algorytmu optymalizacji i nowego zestawu danych szkoleniowych” dostosowanego do rozwiązywania problemów ściśle naukowych. Ponadto wykorzystano w nim „łańcuch myśli” – model, przetwarzając zapytania, stara się rozwiązywać problemy krok po kroku, rozumując podobnie jak ludzie. Dzięki temu o1 ma się specjalizować w nauce, kodowaniu i matematyce.
Efekt? „Na moim polu fizyki kwantowej daje znacznie bardziej szczegółowe i spójne odpowiedzi niż poprzedni model GPT-4o” – mówi magazynowi „Nature” Mario Krenn, lider Artificial Scientist Lab w Instytucie Maxa Plancka w Erlangen. Krenn był jednym z pierwszych naukowców, którym OpenAI umożliwia przetestowanie programu.
ChatGPT dla naukowca
O1 stał się również pierwszym modelem językowym, który przewyższył doktorantów w trudnych testach naukowych – w egzaminie Graduate-Level Google-Proof Q&A Benchmark (GPQA) udzielił poprawnych odpowiedzi na 78 proc. pytań, w tym aż 93 proc. z fizyki (doktoranci osiągnęli poniżej 70 proc.) W teście kwalifikacyjnym do Międzynarodowej Olimpiady Matematycznej model osiągnął wynik 83 proc., podczas gdy poprzedni model GPT-4o poprawnie rozwiązał tylko 13 proc. zadań.
Choć o1 nadal wymaga nadzoru ludzi i weryfikowania odpowiedzi, może być użyteczny dla naukowców. Zespół Krenna opracował na jego podstawie system SciMuse, który wykorzystuje grafy wiedzy zbudowane na podstawie ponad 58 mln artykułów naukowych. SciMuse generuje spersonalizowane pomysły badawcze i sugestie dotyczące współpracy naukowej. „Znajduje znacznie ciekawsze idee niż GPT-4 czy GPT-4o” – zauważa Krenn.
„Tygodnik Powszechny” – jedyny polski tygodnik społeczno-kulturalny.
30 tys. Czytelniczek i Czytelników. Najlepsze Autorki i najlepsi Autorzy.
Wspólnota, która myśli samodzielnie.




















