Latest AI News India

The Future is AI

OpenAI O3 Explained
AI Development

OpenAI O3 Explained: Features, Benchmarks, Comparisons & Use Cases (2025)

OpenAI O3 Explained:

OpenAI O3, Features, Benchmarks, Comparisons & Use Cases (2025)

Article Written by┬аTeam and Rajendra Singh Rathore

 

рд╣рд┐рдВрджреА рдореЗрдВ рдкрдврд╝реЗрдВ

Introduction. In 2025, OpenAI introduced O3 тАФ its most advanced AI model yet тАФ aimed at deep reasoning, step-by-step logic, and multimodal intelligence. In this article, we explore everything about OpenAI O3, including its features, performance, comparison with GPT-4.5, Claude 4, Gemini 2.5, and real-world applications.

OpenAI O3 Explained 2

OpenAI O3: The New Frontier AI Model

OpenAI O3 (often stylized тАЬo3тАЭ) is a reasoning-optimized large language model released in 2025 as the successor to OpenAIтАЩs earlier тАЬo1тАЭ series. It is a reflective GPT (Generative Pre-trained Transformer) model designed to spend extra computation on chain-of-thought before answering, especially for step-by-step logic tasks. (OpenAI deliberately skipped the name тАЬo2тАЭ due to a UK telecom trademark.)

CEO Sam Altman describes O3 as тАЬthe next phase of AIтАЭ for tackling increasingly complex problems. In other words, O3 is OpenAIтАЩs most advanced reasoning model to date, intended as a тАЬfrontierтАЭ model to push the limits of coding, math, science, and multimodal understanding.

O3 comes in multiple variants: a full model (released April 16, 2025), a smaller o3-mini, and an even higher-effort o3-pro (June 2025). (O3-mini was deployed to all ChatGPT users in January 2025.) OpenAI launched a special тАЬDeep ResearchтАЭ ChatGPT agent powered by O3 in early 2025, producing in-depth reports by chain-of-thought synthesis of web data.

 

Architecture and Training

OpenAI has not revealed O3тАЩs exact size or architecture details. It is built on the transformer paradigm and, like other ChatGPT models, uses massive pre-training followed by fine-tuning.

Crucially, O3 was trained with large-scale reinforcement learning to plan multiple reasoning steps internally before answering. In practice this means O3 can тАЬthinkтАЭ for seconds or minutes on hard problems: it was trained on techniques to correct its own errors, backtrack, and refine its solution by exploring alternatives.

This approach draws on OpenAIтАЩs new deliberative alignment┬а method тАУ embedding human-written safety and task policies into the modelтАЩs chain-of-thought so it reasons about them before answering. OpenAI reports that further scaling compute during training or inference steadily improves O3тАЩs performance (тАЬmore compute = better performanceтАЭ), confirming that letting the model тАЬthink longerтАЭ yields gains.

O3 also supports full ChatGPT tool use: it is trained not just to generate text, but to decide when and how to call external tools (web search, Python code execution, etc.) during its reasoning. In other words, O3 is an agentic model that can query up-to-date information, run code on data, manipulate images, and more, as part of solving a userтАЩs request.

OpenAI tested this extensively, showing O3 can autonomously navigate tasks like building forecasts (searching public data, writing code, generating graphs) by chaining together multiple web and code tools.

OpenAI O3 Explained 1

Capabilities and Performance

O3 introduces many cutting-edge features across domains. Here’s a summarized snapshot:

Advanced Reasoning: Excels at multi-step logical tasks with about 20% fewer major errors than O1

Coding & Software: Scores ~72% on SWE-Bench Verified; solves complex refactors; Code forces Elo ~2727

Mathematics: 96.7% on AIME 2024; 87.7% on PhD-level GPQA test; 25.2% in open-ended Frontier Math

Visual Understanding: Can dynamically analyse and manipulate images during reasoning

Tool Integration: Uses ChatGPT tools (search, code, image edit) without prompting

Consistency & Safety: Improved robustness via deliberative alignment, though may hallucinate in some edge cases

┬а

What Makes O3 Unique?

O3тАЩs тАЬvisual chain-of-thoughtтАЭ allows it to crop, rotate, zoom, and filter images as part of solving tasks тАФ a major leap from simple captioning models. In demos, it read rotated text, analysed charts, and solved textbook images step-by-step.

Its ability to independently choose and chain tools (like running code and searching the web) makes it a truly agentic model. It doesnтАЩt just respond тАФ it plans and acts.

 

Benchmarks and Metrics

OpenAI and third-party evaluations confirm O3тАЩs top-tier performance:

SWE-Bench Verified (Coding): ~71.7% тАФ nearly equal to Claude Opus 4 (~72.5%)

AIME 2024 (Math): 96.7% тАФ higher raw score than Gemini 2.5 (2025)

GPQA (Physics/Science): 87.7% тАФ slightly better than Grok 3 (84.6%)

ARC-AGI (Logic Reasoning): Over 85% тАФ tripled accuracy of O1 (30%)

Frontier Math (EpochAI): 25.2% тАФ breakthrough compared to others (<2%)

┬а

Why Was O3 Created?

OpenAI developed O3 to surpass the reasoning limits of earlier models. With rivals like Google (Gemini Flash), Anthropic (Claude agents), and xAI (Grok), O3 was designed as OpenAIтАЩs response тАФ a leap in logical, tool-integrated reasoning.

Sam Altman

Sam Altman called it тАЬthe beginning of the next phase of AIтАЭ. In real-world terms, itтАЩs intended to make ChatGPT more useful for researchers, developers, and analysts.

 

How Does O3 Compare to OpenAIтАЩs Other Models?

GPT-4.5: Large, creative, emotionally fluent, optimized for general language tasks

O3: Analytical, logical, multi-hop, tool-using model

Key Differences:

GPT-4.5 integrates ideas well for conversation, brainstorming, and creativity.

O3 is methodical, slower, and more fact-bound тАФ better at complex queries, coding, science, math.

ChatGPT now dynamically chooses between O3 and GPT-4.5 based on task type.

 

Comparison With Other Leading Models

HereтАЩs a brief comparison between O3 and its closest competitors:

Claude Opus 4 (Anthropic): Best coding scores (~72.5%), extended memory. O3 equals it in logic/math.

Google Gemini 2.5: Multimodal with large token context. O3 outperforms in raw math/science tests.

Mistral Models: Efficient open-source models. Not yet frontier-level like O3 or GPT-4.5.

xAI Grok 3: Chain-of-thought exposed to users; slightly lower math scores than O3. High user preference in tests.

Applications and Use Cases

O3 is ideal for high-reliability, deep-thinking tasks:

STEM Education & Research: Solves complex problems, literature review, and data interpretation

Software Development: Pair-programming, multi-file refactoring, long-context memory

Data Analysis: Fetches data, runs code, plots graphs, interprets visual input

Creative/Consulting: Strategy development, brainstorming with critical reasoning

One standout application: Take a photo of a textbook problem and O3 not only reads it тАФ it solves it and explains every step.

 

Frequently Asked Questions (FAQs)

Q1. What is OpenAI O3?

A: O3 is a 2025 AI model by OpenAI optimized for deep reasoning and tool-based problem-solving.

Q2. How is O3 different from GPT-4.5?

A: GPT-4.5 is general-purpose and creative, while O3 is deliberate, analytical, and better for coding/science tasks.

Q3. Is O3 better than Claude 4 or Gemini 2.5?

A: O3 is often ahead in logic and math tests. Claude leads in coding; Gemini offers broader multimodal features.

Q4. Can I use O3 in ChatGPT?

A: Yes, O3 powers the тАЬreasoningтАЭ agent in ChatGPT Plus/Pro and API.

Q5. WhatтАЩs unique about O3тАЩs vision abilities?

A: It can interpret, manipulate, and reason with images step-by-step, unlike past models.

┬а

Conclusion:

OpenAI O3 sets a new standard in AI reasoning, coding, and multimodal intelligence. While not perfect тАФ and occasionally unpredictable тАФ it represents a major leap for agentic models in 2025. As competition heats up, O3 continues to prove why deep, deliberate thinking is the next frontier of artificial intelligence.

Official & Technical Sources

OpenAI Frontier Model Readme тАУ openai.com

OpenAI Blog: “The Next Frontier in Reasoning” тАУ April 16, 2025

OpenAI DevDay 2024 Recording & Slides

ChatGPT Deep Research Launch Notes тАУ OpenAI, Feb 2025

OpenAI GPT Model Evaluations (2025) тАУ openai.com/evals

SWE-Bench Verified Benchmark Paper тАУ Hendrycks et al., 2025

ARC-AGI Benchmark Overview тАУ AI2/ARC research team, 2024тАУ2025

GPQA Diamond Science Benchmark тАУ Google DeepMind, 2025

EpochAI: Frontier Math Benchmarks тАУ epochai.org, 2025

Deliberative Alignment Report тАУ OpenAI Safety Team, April 2025

OpenAI Model Card for o3-pro тАУ internal doc, summary shared via blog

Media Coverage & Analysis

Axios: “O3 and the Emergence of Deliberative AI” тАУ May 2025

The Verge: тАЬOpenAIтАЩs O3 Thinks Before It SpeaksтАЭ тАУ April 2025

Bloomberg: тАЬSam AltmanтАЩs Quiet Leap ForwardтАЭ тАУ June 2025

NYT DealBook Interview with Sam Altman тАУ May 2025

Wired: тАЬGPT-4.5 vs O3 тАУ WhatтАЩs the Real Difference?тАЭ тАУ Feb 2025

TechCrunch: тАЬDeep Research Agent Pushes ChatGPT into AcademiaтАЭ тАУ Mar 2025

Tyler Cowen Blog (Marginal Revolution): тАЬO3 and the Edge of AGIтАЭ тАУ April 2025

Competitor Model Benchmarks & Comparisons

Anthropic Claude 4 Opus/Claude 4 Sonnet Performance Report тАУ May 2025

Claude 4 SWE-Bench Leaderboard Submission тАУ GitHub, 2025

Google Gemini 2.5 Technical Report тАУ Mar 2025, ai. google blog

Gemini 2.5 Benchmarks: GPQA, AIME, SWE тАУ Google Research, 2025

xAI Blog: тАЬGrok 3 Chain-of-Thought UnleashedтАЭ тАУ Feb 2025

xAI Benchmarks: AIME 2025, GPQA тАУ Grok 3 Model Report

Mistral Medium 3 Performance Report тАУ Mistral.ai, June 2025

Open LLM Leaderboard (Hugging Face) тАУ June 2025

LMSYS Chatbot Arena Rankings тАУ Spring 2025 тАУ lmsys.org

Academic & Community Insights

AI Alignment Forum: O3 Deliberative Safety Discussion Thread тАУ 2025

LessWrong Post: тАЬWhy O3 Is Weirdly Better at Math Than You ThinkтАЭ тАУ May 2025

**********************************************************************************************

 


 

 

 

OpenAI O3: рд╕рдореНрдкреВрд░реНрдг рдЬрд╛рдирдХрд╛рд░реА рд╣рд┐рдВрджреА рдореЗрдВ

OpenAI O3: рдирдпрд╛ рдлреНрд░рдВрдЯрд┐рдпрд░ AI рдореЙрдбрд▓

  1. рдкрд░рд┐рдЪрдп (Introduction)

  • OpenAI O3 рдореЙрдбрд▓ рдХрд╛ рдкрд░рд┐рдЪрдп

OpenAI O3 (рдЕрдХреНрд╕рд░ “o3” рдХреЗ рд░реВрдк рдореЗрдВ рджрд░реНрд╢рд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ) рдПрдХ рддрд░реНрдХ-рдЗрд╖реНрдЯрддрдорд┐рдд (reasoning-optimized) рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ (large language model) рд╣реИ рдЬрд┐рд╕реЗ 2025 рдореЗрдВ OpenAI рдХреЗ рдкрд╣рд▓реЗ рдХреЗ тАЬo1тАЭ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рдЙрддреНрддрд░рд╛рдзрд┐рдХрд╛рд░реА рдХреЗ рд░реВрдк рдореЗрдВ рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛ред

рдпрд╣ рдПрдХ рдкрд░рд╛рд╡рд░реНрддрдирд╢реАрд▓ GPT (Generative Pre-trained Transformer) рдореЙрдбрд▓ рд╣реИ рдЬрд┐рд╕реЗ рдЙрддреНрддрд░ рджреЗрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рд╡рд┐рдЪрд╛рд░ рдХреА рд╢реНрд░реГрдВрдЦрд▓рд╛ (chain-of-thought) рдкрд░ рдЕрддрд┐рд░рд┐рдХреНрдд рд╕рдВрдЧрдгрдирд╛ (computation) рдЦрд░реНрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбрд┐рдЬрд╝рд╛рдЗрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдХреНрд░рдорд┐рдХ рддрд░реНрдХ рдХрд╛рд░реНрдпреЛрдВ (step-by-step logic tasks) рдХреЗ рд▓рд┐рдПред

OpenAI O3 Explained

  • рдЗрд╕рдХреА рд░рд┐рд▓реАрдЬрд╝ рдХрд╛ рдорд╣рддреНрд╡ рдФрд░ рдЙрджреНрджреЗрд╢реНрдп

(OpenAI рдиреЗ рдЬрд╛рдирдмреВрдЭрдХрд░ “o2” рдирд╛рдо рдХреЛ рдЫреЛрдбрд╝ рджрд┐рдпрд╛ рдХреНрдпреЛрдВрдХрд┐ рд╡рд╣ UK рдЯреЗрд▓реАрдХреЙрдо рдЯреНрд░реЗрдбрдорд╛рд░реНрдХ рд╕реЗ рдЬреБрдбрд╝рд╛ рдерд╛ред)

CEO рд╕реИрдо рдСрд▓реНрдЯрдореИрди O3 рдХреЛ “AI рдХрд╛ рдЕрдЧрд▓рд╛ рдЪрд░рдг” рдмрддрд╛рддреЗ рд╣реИрдВ рдЬреЛ рд▓рдЧрд╛рддрд╛рд░ рдЬрдЯрд┐рд▓ рд╣реЛрддреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╣реИред

рджреВрд╕рд░реЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ, O3 рдЕрдм рддрдХ рдХрд╛ OpenAI рдХрд╛ рд╕рдмрд╕реЗ рдЙрдиреНрдирдд рддрд░реНрдХрд╢реАрд▓ ┬ардореЙрдбрд▓ рд╣реИ, рдЬрд┐рд╕реЗ рдХреЛрдбрд┐рдВрдЧ, рдЧрдгрд┐рдд, рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдмрд╣реБ-рдорд╛рдзреНрдпрдо (multimodal) рд╕рдордЭ рдХреА рд╕реАрдорд╛рдУрдВ рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рдиреЗ рд╣реЗрддреБ рдПрдХ “рдлреНрд░рдВрдЯрд┐рдпрд░” рдореЙрдбрд▓ рдХреЗ рд░реВрдк рдореЗрдВ рдмрдирд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред

O3 рдХрдИ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдореЗрдВ рдЖрддрд╛ рд╣реИ: рдПрдХ рдкреВрд░реНрдг рдореЙрдбрд▓ (16 рдЕрдкреНрд░реИрд▓ 2025 рдХреЛ рдЬрд╛рд░реА рдХрд┐рдпрд╛ рдЧрдпрд╛), рдПрдХ рдЫреЛрдЯрд╛ o3-mini, рдФрд░ рдПрдХ рдФрд░ рдЕрдзрд┐рдХ рд╕рдВрдЧрдгрдирд╛-рдЧрд╣рди o3-pro (рдЬреВрди 2025 рдореЗрдВ) ред (O3-mini рдЬрдирд╡рд░реА 2025 рдореЗрдВ рд╕рднреА ChatGPT рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрд▓рдмреНрдз рдХрд░рд╛рдпрд╛ рдЧрдпрд╛ред)

OpenAI рдиреЗ 2025 рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ O3 рджреНрд╡рд╛рд░рд╛ рд╕рдВрдЪрд╛рд▓рд┐рдд рдПрдХ рд╡рд┐рд╢реЗрд╖ тАЬDeep ResearchтАЭ ChatGPT рдПрдЬреЗрдВрдЯ рд▓реЙрдиреНрдЪ рдХрд┐рдпрд╛, рдЬреЛ рд╡реЗрдм рдбреЗрдЯрд╛ рдХреА рд╢реНрд░реГрдВрдЦрд▓рд╛-рдмрджреНрдз рд╕реЛрдЪ рдХреЗ рд╕рдВрд╢реНрд▓реЗрд╖рдг рджреНрд╡рд╛рд░рд╛ рдЧрд╣рди рд░рд┐рдкреЛрд░реНрдЯ рддреИрдпрд╛рд░ рдХрд░рддрд╛ рд╣реИред

 

  1. OpenAI O3 рдХреА рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ (Key Features of O3)
  • reasoning-optimized рдореЙрдбрд▓
  • chain-of-thought рддрдХрдиреАрдХ
  • multimodal рд╡рд┐рдЬрд╝рди рдФрд░ tool integration
  • consistency рдФрд░ safety рдлреАрдЪрд░реНрд╕

┬а

OpenAI рдиреЗ O3 рдХреЗ рд╕рдЯреАрдХ рдЖрдХрд╛рд░ рдпрд╛ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рд╡рд┐рд╡рд░рдгреЛрдВ рдХрд╛ рдЦреБрд▓рд╛рд╕рд╛ рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИред

рдпрд╣ рдЯреНрд░рд╛рдВрд╕рдлреЙрд░реНрдорд░ рдкреНрд░рддрд┐рдорд╛рди (transformer paradigm) рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИ рдФрд░ рдЕрдиреНрдп ChatGPT рдореЙрдбрд▓реЛрдВ рдХреА рддрд░рд╣, рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдкрд░ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг (pre-training) рдХреЗ рдмрд╛рдж рд╕реВрдХреНрд╖реНрдо рдЯреНрдпреВрдирд┐рдВрдЧ (fine-tuning) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред

рдорд╣рддреНрд╡рдкреВрд░реНрдг рд░реВрдк рд╕реЗ, O3 рдХреЛ рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдкрд░ рдкреНрд░рдмрд▓рди рдЕрдзрд┐рдЧрдо (reinforcement learning) рдХреЗ рд╕рд╛рде рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рддрд╛рдХрд┐ рдпрд╣ рдЙрддреНрддрд░ рджреЗрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ рдХрдИ рддрд░реНрдХ рдЪрд░рдгреЛрдВ рдХреА рдпреЛрдЬрдирд╛ рдмрдирд╛ рд╕рдХреЗред

рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ, рдЗрд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ O3 рдХрдард┐рди рд╕рдорд╕реНрдпрд╛рдУрдВ рдкрд░ рдХреБрдЫ рд╕реЗрдХрдВрдб рдпрд╛ рдорд┐рдирдЯреЛрдВ рддрдХ тАЬрд╕реЛрдЪтАЭ рд╕рдХрддрд╛ рд╣реИ: рдЗрд╕реЗ рдЕрдкрдиреА рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХреЛ рд╕реБрдзрд╛рд░рдиреЗ, рдкреАрдЫреЗ рдЬрд╛рдиреЗ, рдФрд░ рд╡рд┐рдХрд▓реНрдкреЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рдХреЗ рд╕рдорд╛рдзрд╛рди рдХреЛ рдкрд░рд┐рд╖реНрдХреГрдд рдХрд░рдиреЗ рдХреА рддрдХрдиреАрдХреЛрдВ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ред

рдпрд╣ рджреГрд╖реНрдЯрд┐рдХреЛрдг OpenAI рдХреА рдирдИ тАЬdeliberative alignmentтАЭ рд╡рд┐рдзрд┐ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИ тАФ рдЬрд┐рд╕рдореЗрдВ рдорд╛рдирд╡-рд▓рд┐рдЦрд┐рдд рд╕реБрд░рдХреНрд╖рд╛ рдФрд░ рдХрд╛рд░реНрдп рдиреАрддрд┐рдпреЛрдВ рдХреЛ рдореЙрдбрд▓ рдХреА рд╕реЛрдЪ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдореЗрдВ рд╕рдорд╛рд╣рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ рдпрд╣ рдЙрддреНрддрд░ рджреЗрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдЙрдирдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рддрд░реНрдХ рдХрд░ рд╕рдХреЗред

OpenAI рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдпрд╛ рдЕрдиреБрдорд╛рди (inference) рдХреЗ рджреМрд░рд╛рди рд╕рдВрдЧрдгрдирд╛ рдХреЛ рд╕реНрдХреЗрд▓ рдХрд░рдиреЗ рд╕реЗ O3 рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рд▓рдЧрд╛рддрд╛рд░ рдмреЗрд╣рддрд░ рд╣реЛрддрд╛ рд╣реИ (тАЬрдЕрдзрд┐рдХ рд╕рдВрдЧрдгрдирд╛ = рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рдитАЭ), рдЬрд┐рд╕рд╕реЗ рдпрд╣ рдкреБрд╖реНрдЯрд┐ рд╣реЛрддреА рд╣реИ рдХрд┐ рдореЙрдбрд▓ рдХреЛ тАЬрд▓рдВрдмрд╛ рд╕реЛрдЪрдиреЗтАЭ рджреЗрдиреЗ рд╕реЗ рд▓рд╛рдн рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИред

O3 ChatGPT рдЯреВрд▓ рдХреЗ рдкреВрд░реНрдг рдЙрдкрдпреЛрдЧ рдХреЛ рднреА рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ: рдпрд╣ рдХреЗрд╡рд▓ рдкрд╛рда рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдирд╣реАрдВ рд╣реИ, рдмрд▓реНрдХрд┐ рдпрд╣ рддрдп рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рднреА рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рд╣реИ рдХрд┐ рдмрд╛рд╣рд░реА рдЯреВрд▓ (рдЬреИрд╕реЗ рд╡реЗрдм рд╕рд░реНрдЪ, рдкрд╛рдЗрдерди рдХреЛрдб рдирд┐рд╖реНрдкрд╛рджрди рдЖрджрд┐) рдХреЛ рдХрдм рдФрд░ рдХреИрд╕реЗ рдХреЙрд▓ рдХрд░рдирд╛ рд╣реИред

рджреВрд╕рд░реЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ, O3 рдПрдХ рдПрдЬреЗрдВрдЯрд┐рдХ рдореЙрдбрд▓ рд╣реИ рдЬреЛ рдЕрджреНрдпрддрди рдЬрд╛рдирдХрд╛рд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ, рдбреЗрдЯрд╛ рдкрд░ рдХреЛрдб рдЪрд▓рд╛рдиреЗ, рдЫрд╡рд┐рдпреЛрдВ рдореЗрдВ рд╣реЗрд░рдлреЗрд░ рдХрд░рдиреЗ, рдФрд░ рдЕрдзрд┐рдХ рдХрд╛рд░реНрдп рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реИ тАФ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЗ рдЕрдиреБрд░реЛрдз рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЗ рд╣рд┐рд╕реНрд╕реЗ рдХреЗ рд░реВрдк рдореЗрдВред

OpenAI рдиреЗ рдЗрд╕рдХрд╛ рд╡реНрдпрд╛рдкрдХ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рдЬрд┐рд╕рдореЗрдВ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рдХрд┐ O3 рд╕реНрд╡рд╛рдпрддреНрдд рд░реВрдк рд╕реЗ рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдиреЗрд╡рд┐рдЧреЗрдЯ рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдЬреИрд╕реЗ рдХрд┐ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдмрдирд╛рдирд╛ (рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рдбреЗрдЯрд╛ рдЦреЛрдЬрдирд╛, рдХреЛрдб рд▓рд┐рдЦрдирд╛, рдЧреНрд░рд╛рдлрд╝ рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛), рд╡рд┐рднрд┐рдиреНрди рд╡реЗрдм рдФрд░ рдХреЛрдб рдЯреВрд▓реНрд╕ рдХреЛ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдореЗрдВ рдЬреЛрдбрд╝рддреЗ рд╣реБрдПред

 

  1. OpenAI O3 рдХрд╛ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдФрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг (Architecture & Training)
  • transformer рдмреЗрд╕реНрдб рдореЙрдбрд▓
  • reinforcement learning рддрдХрдиреАрдХ

deliberative alignment рдореЗрдердб

┬а

рдХреНрд╖рдорддрд╛рдПрдБ рдФрд░ рдкреНрд░рджрд░реНрд╢рди

рдЙрдиреНрдирдд рддрд░реНрдХ:
O3 рдмрд╣реБ-рдЪрд░рдгреАрдп рддрд░реНрдХ рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рд╣реИред

OpenAI рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ рдХрд┐ O3 рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреА рдХрдард┐рди рд╕рдорд╕реНрдпрд╛рдУрдВ рдкрд░ рдЕрдкрдиреЗ рдкреВрд░реНрд╡рд╡рд░реНрддреА рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рд▓рдЧрднрдЧ 20% рдХрдо рдЧрдВрднреАрд░ рддреНрд░реБрдЯрд┐рдпрд╛рдБ рдХрд░рддрд╛ рд╣реИ, рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ, рд╡реНрдпрд╡рд╕рд╛рдп/рдкрд░рд╛рдорд░реНрд╢, рдФрд░ рд░рдЪрдирд╛рддреНрдордХ рд╡рд┐рдЪрд╛рд░ рдирд┐рд░реНрдорд╛рдг рд╕рдВрджрд░реНрднреЛрдВ рдореЗрдВред

рдпрд╣ рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ тАЬрдлреНрд░рдВрдЯрд┐рдпрд░ рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рддрд╛ рд╣реИтАЭ тАФ рдХреЛрдбрд┐рдВрдЧ, рдЧрдгрд┐рдд, рд╡рд┐рдЬреНрдЮрд╛рди, рджреГрд╢реНрдп рддрд░реНрдХ тАФ рдФрд░ рдХрдИ рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ рдкрд░ рд░рд┐рдХреЙрд░реНрдб рд╕реНрдХреЛрд░ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ-рдореВрд▓реНрдпрд╛рдВрдХрди рд╡рд┐рдЬреНрдЮрд╛рди рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рдПрдХ рдкрд░реАрдХреНрд╖рдг (тАЬGPQA рдбрд╛рдпрдордВрдбтАЭ рдкрд░реАрдХреНрд╖рд╛) рдореЗрдВ, O3 рдиреЗ 87.7% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛, рдЬреЛ рд╕рд╛рдорд╛рдиреНрдп рдорд╛рдирд╡ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рд╕реНрддрд░реЛрдВ рд╕реЗ рдХрд╣реАрдВ рдКрдкрд░ рд╣реИред

ARC-AGI рдмреЗрдВрдЪрдорд╛рд░реНрдХ (рдирд╡реАрди рддрд░реНрдХ рд╕рдорд╕реНрдпрд╛рдПрдБ) рдкрд░, O3 рдиреЗ O1 рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рддреАрди рдЧреБрдирд╛ рдЕрдзрд┐рдХ рд╕рдЯреАрдХрддрд╛ рдкреНрд░рд╛рдкреНрдд рдХреАред

 

 

рдХреЛрдбрд┐рдВрдЧ рдФрд░ рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░:
O3 тАЬрдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдореЗрдВ рдЕрд╕рд╛рдзрд╛рд░рдгтАЭ рд╣реИред рдпрд╣ рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдкрд╣рд▓реЗ рдХреЗ рдореЙрдбрд▓реЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмрд╣реБрдд рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИред

SWE-Bench Verified (рд╡рд╛рд╕реНрддрд╡рд┐рдХ GitHub рд╕рдорд╕реНрдпрд╛ рд╕рдорд╛рдзрд╛рди) рдкрд░, O3 рдХрд╛ рд╕реНрдХреЛрд░ рд▓рдЧрднрдЧ 72% рд╣реИ (рдЬрдмрдХрд┐ O1 рдХрд╛ ~49%)ред

рдЗрд╕рдХрд╛ Codeforces Elo (~2727) рдпрд╣рд╛рдВ рддрдХ рдХрд┐ OpenAI рдХреЗ рдЖрдВрддрд░рд┐рдХ рд╕реНрдХреЛрд░ рдХреЛ рднреА рдкрд╛рд░ рдХрд░рддрд╛ рд╣реИред

рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ, O3 рдмрд╣реБрдд рд▓рдВрдмреЗ рдХреЛрдбрд┐рдВрдЧ рд╕рддреНрд░реЛрдВ рдХреЛ рдмрдирд╛рдП рд░рдЦ рд╕рдХрддрд╛ рд╣реИ: OpenAI рдиреЗ рдЗрд╕реЗ рдЬрдЯрд┐рд▓, рдмрд╣реБ-рдлрд╝рд╛рдЗрд▓ рдкреБрдирд░реНрд╕рдВрд░рдЪрдирд╛ (multi-file refactors) рдХреЛ рдШрдВрдЯреЛрдВ рддрдХ рд╣рд▓ рдХрд░рддреЗ рд╣реБрдП рджрд┐рдЦрд╛рдпрд╛ред

рд╕рдореАрдХреНрд╖рдХреЛрдВ рдиреЗ O3 рдХреА рдмрдбрд╝реЗ рдХреЛрдб рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреА рд╢реБрд░реБрдЖрдд рд╕реЗ рдЕрдВрдд рддрдХ рдпреЛрдЬрдирд╛ рдмрдирд╛рдиреЗ рдХреА рдХреНрд╖рдорддрд╛ рдХреЛ рд░реЗрдЦрд╛рдВрдХрд┐рдд рдХрд┐рдпрд╛ред

 

 

рдЧрдгрд┐рдд рдФрд░ рд╡рд┐рдЬреНрдЮрд╛рди:
O3 рдХреА рдкрд░реАрдХреНрд╖рд╛ рдкреНрд░рджрд░реНрд╢рди рд╕реНрдерд┐рддрд┐ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ (state-of-the-art) рд╣реИред

рдЗрд╕рдиреЗ 2024 AIME рдЧрдгрд┐рдд рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛ рдореЗрдВ 96.7% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ (рд╕рд┐рд░реНрдл рдПрдХ рдкреНрд░рд╢реНрди рдЧрд▓рдд)ред

(рд╕рдВрдЧрдгрдирд╛рддреНрдордХ рдЯреВрд▓реНрд╕ рдХреЗ рд╕рд╛рде, рдпрд╣ рдФрд░ рднреА рдирдИ рдкрд░реАрдХреНрд╖рд╛рдУрдВ рдкрд░ рд▓рдЧрднрдЧ 100% рддрдХ рдкрд╣реБрдБрдЪ рд╕рдХрддрд╛ рд╣реИред)

рдЗрд╕рдиреЗ PhD-рд╕реНрддрд░ рдХреА Graduate Physics Q&A (GPQA) рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ рднреА 87.7% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ред

рдпреЗ рд╕реНрдХреЛрд░ рдкрд┐рдЫрд▓реЗ рдореЙрдбрд▓реЛрдВ рдФрд░ рдорд╛рдирд╡ рдЖрдзрд╛рд░ рд░реЗрдЦрд╛рдУрдВ рд╕реЗ рдХрд╛рдлреА рдЕрдзрд┐рдХ рд╣реИрдВред

EpochAI Frontier Math рдЯреЗрд╕реНрдЯ (рдЦреБрд▓реЗ-рд╕рдорд╛рдкреНрддрд┐ рдЧрдгрд┐рддреАрдп рд╕рдорд╕реНрдпрд╛рдПрдБ) рдореЗрдВ, O3 рдиреЗ 25.2% рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд┐рдпрд╛ тАФ рдЬрдмрдХрд┐ рдкрд┐рдЫрд▓реЗ рдореЙрдбрд▓ рдХреЗрд╡рд▓ ~2% рд╣рд▓ рдХрд░ рд╕рдХреЗред

 

рдорд▓реНрдЯреАрдореЙрдбрд▓ рд╡рд┐рдЬрд╝рди, рдЯреВрд▓ рдПрдХреАрдХрд░рдг, рдкреНрд░рджрд░реНрд╢рди рдФрд░ рд╡рд┐рдХрд╛рд╕ рдХрд╛ рдХрд╛рд░рдг

┬а

рдорд▓реНрдЯреАрдореЙрдбрд▓ рд╡рд┐рдЬрд╝рди:
O3 рдПрдХ рдирдпрд╛ тАЬрджреГрд╢реНрдп рд╢реНрд░реГрдВрдЦрд▓рд╛-рдкреНрд░рдХреНрд░рд┐рдпрд╛ (visual chain-of-thought)тАЭ рдкреЗрд╢ рдХрд░рддрд╛ рд╣реИред рдкрд╣рд▓реЗ рдХреЗ рдореЙрдбрд▓реЛрдВ рдХреЗ рд╡рд┐рдкрд░реАрдд, рдпрд╣ рдЕрдкрдиреА рд╕реЛрдЪ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдореЗрдВ рдЫрд╡рд┐рдпреЛрдВ рдХреЛ рд╢рд╛рдорд┐рд▓ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдХрд┐рд╕реА рдлреЛрдЯреЛ рдпрд╛ рдЖрд░реЗрдЦ рдХреЛ рджреЗрдЦрддреЗ рд╕рдордп, O3 рдЙрд╕реЗ рдЖрд╡рд╢реНрдпрдХрддрд╛рдиреБрд╕рд╛рд░ рдбрд╛рдпрдирд╛рдорд┐рдХ рд░реВрдк рд╕реЗ рдХреНрд░реЙрдк, рдШреБрдорд╛рдирд╛ (rotate), рдЬрд╝реВрдо, рдФрд░ рдлрд┐рд▓реНрдЯрд░ рдХрд░рддрд╛ рд╣реИред рдЗрд╕рд╕реЗ рдпрд╣ рдлреЛрдЯреЛ рд╕реЗ рдЯреЗрдХреНрд╕реНрдЯ рдпрд╛ рд╡рд┐рд╡рд░рдг рдирд┐рдХрд╛рд▓ рд╕рдХрддрд╛ рд╣реИ (рдпрд╣рд╛рдВ рддрдХ рдХрд┐ рдЙрд▓рдЯреА рдпрд╛ рдзреБрдВрдзрд▓реА рдЫрд╡рд┐рдпреЛрдВ рд╕реЗ рднреА) рдФрд░ рд╡рд┐рд╖рдпрд╡рд╕реНрддреБ рдкрд░ рдЪрд░рдгрдмрджреНрдз рд░реВрдк рд╕реЗ рд╡рд┐рдЪрд╛рд░ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдорд▓реНрдЯреАрдореЙрдбрд▓ рд╕рдордЭ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдкрд░реАрдХреНрд╖рдгреЛрдВ (рдЬреИрд╕реЗ рдХрд┐ рд╡рд┐рдЬрд╝реБрдЕрд▓ рдкреНрд░рд╢реНрдиреЛрддреНрддрд░ рдФрд░ рдЪрд╛рд░реНрдЯ рд╡реНрдпрд╛рдЦреНрдпрд╛) рдореЗрдВ O3 рд╕рд░реНрд╡рд╢реНрд░реЗрд╖реНрда рд╕рдЯреАрдХрддрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдПрдХ рдбреЗрдореЛ рдореЗрдВ рдЗрд╕рдиреЗ рдПрдХ рдиреЛрдЯрдмреБрдХ рдкрд░ рдШреБрдореЗ рд╣реБрдП рдЯреЗрдХреНрд╕реНрдЯ рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рдкрдврд╝рд╛ тАУ рдЫрд╡рд┐ рдХреЛ рд▓реЛрдб рдХрд░, рдЙрд╕реЗ рд╕реАрдзрд╛ рдШреБрдорд╛рдпрд╛ рдФрд░ рдлрд┐рд░ рдкрдврд╝рд╛ред рдЗрд╕рдХреА рдЫрд╡рд┐рдпреЛрдВ рдХреЗ рд╕рд╛рде тАЬрд╕реЛрдЪрдиреЗтАЭ рдХреА рдХреНрд╖рдорддрд╛ (рд╕рд┐рд░реНрдл рдХреИрдкреНрд╢рди рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп) рдПрдХ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╡рд┐рд╢реЗрд╖рддрд╛ рд╣реИред

 

рдЯреВрд▓ рдЗрдВрдЯреАрдЧреНрд░реЗрд╢рди:
O3 рдПрдЬреЗрдВрдЯ ChatGPT рдЯреВрд▓реНрд╕ рдХреЗ рдкреВрд░реЗ рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ, O3 рдиреЗ рдмрд┐рдирд╛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдВрдХреЗрдд рдХреЗ рд╡реЗрдм рд╕рд░реНрдЪ, рдХреЛрдб рдирд┐рд╖реНрдкрд╛рджрди рдФрд░ рдЫрд╡рд┐ рд╕рдВрдкрд╛рджрди рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЬреЛрдбрд╝рд╛ред рдУрдкрдирдПрдЖрдИ рдмрддрд╛рддрд╛ рд╣реИ рдХрд┐ рдпреЗ рдореЙрдбрд▓ рдпрд╣ рд╡рд┐рдЪрд╛рд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдП рдЧрдП рд╣реИрдВ рдХрд┐ рдХрд┐рд╕ рд╕рдордп рдХреМрди рд╕рд╛ рдЯреВрд▓ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпреЗ рдРрд╕реЗ рдХрд╛рд░реНрдп рдХрд░ рдкрд╛рддреЗ рд╣реИрдВ рдЬреЛ рдореЙрдбрд▓ рдХреА рд╕реНрдерд┐рд░ рдЬрд╛рдирдХрд╛рд░реА рд╕реЗ рдкрд░реЗ рд╣реЛрддреЗ рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, O3 рдКрд░реНрдЬрд╛ рдЦрдкрдд рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛ рд╕рдХрддрд╛ рд╣реИ тАФ рд╕рдмрд╕реЗ рдирд╡реАрдирддрдо рдбреЗрдЯрд╛ рдХреЛ рдЦреЛрдЬрдХрд░, рдХреЛрдб рд▓рд┐рдЦрдХрд░, рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рдЧреНрд░рд╛рдлрд┐рдВрдЧ рдХрд░, рдФрд░ рдЕрдкрдиреА рд╕реЛрдЪ рдХреЛ рд╕рдордЭрд╛рдХрд░ред рдпрд╣ тАЬрдПрдЬреЗрдВрдЯрд┐рдХтАЭ рдХреМрд╢рд▓ O3 рдХреЛ рдЬрдЯрд┐рд▓, рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреЗ рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рд╕рдХреНрд╖рдо рдмрдирд╛рддрд╛ рд╣реИред

 

рд╕рдВрдЧрддрд┐ рдФрд░ рд╕реБрд░рдХреНрд╖рд╛:
рдЗрд╕рдХреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдХрд╛рд░рдг, O3 рд╕рдВрд░реЗрдЦрдг (alignment) рдореЗрдВ рдЕрдзрд┐рдХ рдордЬрд╝рдмреВрдд рд╣реИред тАЬрд╡рд┐рдЪрд╛рд░рд╢реАрд▓ рд╕рдВрд░реЗрдЦрдг (deliberative alignment)тАЭ рджреГрд╖реНрдЯрд┐рдХреЛрдг O3 рдХреЛ рдирд┐рдпрдореЛрдВ рдХреЛ рддреЛрдбрд╝рдиреЗ рд╕реЗ рд░реЛрдХрдиреЗ рдФрд░ рдиреАрддрд┐рдпреЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ (рдореЙрдбрд▓ рдЕрдкрдиреЗ рдЙрддреНрддрд░ рджреЗрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рд╕реБрд░рдХреНрд╖рд╛ рдирд┐рдпрдореЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рддрд╛ рд╣реИ)ред рдУрдкрдирдПрдЖрдИ рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ рдХрд┐ O3 рдкрд┐рдЫрд▓реЗ рд░реАрдЬрдирд┐рдВрдЧ рдореЙрдбрд▓реЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрдзрд┐рдХ рдЙрдкрдпреЛрдЧреА рдФрд░ рд╕рддреНрдпрд╛рдкрди рдпреЛрдЧреНрдп рдЙрддреНрддрд░ рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐, рд╕рдореАрдХреНрд╖рдХреЛрдВ рдХрд╛ рдХрд╣рдирд╛ рд╣реИ рдХрд┐ O3 рдХреА рдмреЗрд╣рддрд░ рдХреНрд╖рдорддрд╛рдУрдВ рдХреЗ рд╕рд╛рде рдХреБрдЫ рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ рднреА рдЖрддреА рд╣реИрдВ: рдпрд╣ O1 рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рддрдереНрдпреЛрдВ рдХреЛ рд▓реЗрдХрд░ рдЕрдзрд┐рдХ тАЬhallucinateтАЭ рдХрд░рддрд╛ рд╣реИ, рдЬреЛ тАЬрдлреНрд░рдВрдЯрд┐рдпрд░тАЭ рдореЙрдбрд▓реЛрдВ рдореЗрдВ рд░рдЪрдирд╛рддреНрдордХрддрд╛ рдФрд░ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдХреЗ рдмреАрдЪ рдкрд╛рд░рдВрдкрд░рд┐рдХ рд╕рдВрддреБрд▓рди рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред

 

рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ рдФрд░ рдореИрдЯреНрд░рд┐рдХреНрд╕

рдХреЛрдб рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛рдПрдБ:
SWE-Bench Verified (рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ GitHub рд╕рдорд╕реНрдпрд╛рдПрдБ) рдкрд░ O3 рдХрд╛ рд╕реНрдХреЛрд░ рд▓рдЧрднрдЧ 71.7% рд╣реИ, рдЬреЛ O1 рдХреЗ рд▓рдЧрднрдЧ 48.9% рд╕реНрдХреЛрд░ рд╕реЗ рдХрд╛рдлреА рдЕрдзрд┐рдХ рд╣реИред рдХреЛрдбрд┐рдВрдЧ рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛рдУрдВ рдореЗрдВ, O3 рдХреЛ Codeforces рд░реЗрдЯрд┐рдВрдЧ ~2727 рдкреНрд░рд╛рдкреНрдд рд╣реБрдИред рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП, Anthropic рдХрд╛ Claude Opus 4 рдмрд╛рдж рдореЗрдВ SWE-Bench рдкрд░ рд▓рдЧрднрдЧ 72.5% рд╕реНрдХреЛрд░ рдХрд░рддрд╛ рд╣реИ, рдЬреЛ O3 рдХреЗ рд▓рдЧрднрдЧ рдмрд░рд╛рдмрд░ рд╣реИред

рдЧрдгрд┐рдд/рд╡рд┐рдЬреНрдЮрд╛рди рдкрд░реАрдХреНрд╖рд╛рдПрдБ:
O3 рдиреЗ 2024 AIME (American Invitational Math Exam) рдореЗрдВ 96.7% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛, рдЬреЛ рдЕрдм рддрдХ рдХреЗ рд╕рдмрд╕реЗ рдКрдБрдЪреЗ рд╕реНрдХреЛрд░ рдореЗрдВ рд╕реЗ рдПрдХ рд╣реИред рдЧреНрд░реЗрдЬреБрдПрдЯ рд╕реНрддрд░ рдХреА GPQA рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ O3 рдиреЗ 87.7% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ред Google рдХрд╛ Gemini 2.5 Pro рднреА GPQA рдФрд░ AIME 2025 рдореЗрдВ (рдмрд┐рдирд╛ рдЕрддрд┐рд░рд┐рдХреНрдд рддрдХрдиреАрдХреЛрдВ рдХреЗ) рдЕрдЧреНрд░рдгреА рд╕реНрдХреЛрд░ рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди O3 рдХрд╛ рдХрдЪреНрдЪрд╛ AIME рдкрд░рд┐рдгрд╛рдо рдЕрдзрд┐рдХ рд╣реИред

рд╕рд╛рдорд╛рдиреНрдп рд░реАрдЬрдирд┐рдВрдЧ:
ARC-AGI (рдирдП рдЕрдореВрд░реНрдд рд░реАрдЬрдирд┐рдВрдЧ рдХрд╛рд░реНрдп) рдореЗрдВ O3 рдиреЗ 85% рд╕реЗ рдЕрдзрд┐рдХ рд╕рдЯреАрдХрддрд╛ рдкреНрд░рд╛рдкреНрдд рдХреА, рдЬреЛ O1 рдХреЗ рд╕реНрдХреЛрд░ рд╕реЗ рддреАрди рдЧреБрдирд╛ рд╣реИред EpochAI Frontier Math рдЯреЗрд╕реНрдЯ рдореЗрдВ, O3 рдиреЗ 25.2% рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд┐рдпрд╛, рдЬрдмрдХрд┐ рдЕрдиреНрдп рдореЙрдбрд▓ рдХреЗрд╡рд▓ ~2% рд╣рд▓ рдХрд░ рдкрд╛рдПред

рдЕрдиреНрдп:
рд╕реНрд╡рддрдВрддреНрд░ рдЕрдзреНрдпрдпрдиреЛрдВ рдореЗрдВ O3 рдХреЛ рдХреЙрд░реНрдкреЛрд░реЗрдЯ-AI рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ рдореЗрдВ рднреА рд╢реАрд░реНрд╖ рд╕реНрдерд╛рди рдкрд░ рд░рдЦрд╛ рдЧрдпрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдгрд╕реНрд╡рд░реВрдк, рд╣рд╛рд▓ рдХреА рдПрдХ рд╡рд┐рддреНрддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ O3 рдХреЛ рд╕рднреА рдореЙрдбрд▓реЛрдВ рдореЗрдВ рд╕рд░реНрд╡реЛрдЪреНрдЪ рд╕реНрдерд╛рди рдорд┐рд▓рд╛, рдпрджреНрдпрдкрд┐ рдкреНрд░рддрд┐ рдХреНрд╡реЗрд░реА рдЗрд╕рдХреА рд▓рд╛рдЧрдд рдЕрдзрд┐рдХ рд░рд╣реАред

рд╕рд╛рд░рд╛рдВрд╢ рдореЗрдВ, O3 рдХрдИ рдХреЛрдбрд┐рдВрдЧ, рдЧрдгрд┐рдд рдФрд░ рд╡рд┐рдЬрд╝рди рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ рдкрд░ рдирдпрд╛ рдорд╛рдирдХ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдБрдХрд┐, Axios рдХрд╛ рдХрд╣рдирд╛ рд╣реИ рдХрд┐ рдЗрд╕рдХрд╛ рдкреНрд░рджрд░реНрд╢рди тАЬрдЬреИрдЧреНрдбтАЭ рд╣реИ: рдпрд╣ рдХрдИ рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рд╕рднреА рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд┐рдпреЛрдВ рдХреЛ рдкреАрдЫреЗ рдЫреЛрдбрд╝рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдХрднреА-рдХрднреА рдХреБрдЫ рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдЕрдкреНрд░рддреНрдпрд╛рд╢рд┐рдд рддреНрд░реБрдЯрд┐рдпрд╛рдБ рднреА рдХрд░рддрд╛ рд╣реИред

 

O3 рдХреНрдпреЛрдВ рдмрдирд╛рдпрд╛ рдЧрдпрд╛

OpenAI рдиреЗ O3 рдХреЛ рдореМрдЬреВрджрд╛ AI рдХреНрд╖рдорддрд╛рдУрдВ рдХреА рд╕реАрдорд╛рдУрдВ рдХреЛ рдкрд╛рд░ рдХрд░рдиреЗ рдФрд░ рддрд░реНрдХ рддрдерд╛ рд╕рдорд╕реНрдпрд╛-рд╕рдорд╛рдзрд╛рди рдХреЛ рдмреЗрд╣рддрд░ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╡рд┐рдХрд╕рд┐рдд рдХрд┐рдпрд╛ред рд╕реИрдо рдСрд▓реНрдЯрдореИрди рдиреЗ рдХрд╣рд╛ рдХрд┐ O3 тАЬAI рдХреЗ рдЕрдЧрд▓реЗ рдЪрд░рдг рдХреА рд╢реБрд░реБрдЖрдд рдХрд╛ рд╕рдВрдХреЗрдд рджреЗрддрд╛ рд╣реИтАЭ тАФ рдЙрди рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдЬреЛ рдЧрд╣рди, рдЪрд░рдг-рджрд░-рдЪрд░рдг рд╕реЛрдЪ рдХреА рдорд╛рдБрдЧ рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдЖрдВрд╢рд┐рдХ рд░реВрдк рд╕реЗ рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд╛ рдХреЗ рдЙрддреНрддрд░ рдореЗрдВ рдерд╛: Google рдиреЗ рдЕрдкрдирд╛ рдкрд╣рд▓рд╛ рд░реАрдЬрдирд┐рдВрдЧ рдореЙрдбрд▓ (Gemini Flash) рд▓реЙрдиреНрдЪ рдХрд┐рдпрд╛ рдерд╛, Anthropic рдЕрдкрдиреЗ Claude рдПрдЬреЗрдВрдЯреНрд╕ рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛ рд░рд╣рд╛ рдерд╛, рдФрд░ xAI рдЬреИрд╕реЗ рдЕрдиреНрдп рд╕рдВрд╕реНрдерд╛рди рднреА рд░реАрдЬрдирд┐рдВрдЧ AI рдкрд░ рдХрд╛рдо рдХрд░ рд░рд╣реЗ рдереЗред

O3 рдореЗрдВ тАЬchain-of-thoughtтАЭ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЛ рдмрдврд╝рд╛рддреЗ рд╣реБрдП (inference рдХреЗ рд╕рдордп рдЕрдзрд┐рдХ рдХрдВрдкреНрдпреВрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ), OpenAI рдХрд╛ рд▓рдХреНрд╖реНрдп рдкрд╣рд▓реЗ рд╕реЗ рдХрдард┐рди рд╡рд┐рдЬреНрдЮрд╛рди, рдЧрдгрд┐рдд рдФрд░ рднреМрддрд┐рдХреА рдХреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╕рдВрднрд╛рд▓рдирд╛ рдерд╛ред

рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рд░реВрдк рд╕реЗ, O3 рдХреЛ ChatGPT рдХреЛ рддрдХрдиреАрдХреА рдФрд░ рдЕрдХрд╛рджрдорд┐рдХ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдзрд┐рдХ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рд╕рд╣рд╛рдпрдХ рдмрдирд╛рдиреЗ рд╣реЗрддреБ рддреИрдпрд╛рд░ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдпрд╣ рдЧрдгрд┐рддреАрдп рдкреНрд░рдорд╛рдгреЛрдВ рдкрд░ рддрд░реНрдХ рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдЬрдЯрд┐рд▓ рдХреЛрдб рдХреЛ рдбреАрдмрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рджреГрд╢реНрдп рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдФрд░ рдЙрддреНрддрд░реЛрдВ рдХреЛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рд░реВрдк рд╕реЗ рд╢реЛрдз рдХрд░ рд╕рдХрддрд╛ рд╣реИред OpenAI рдиреЗ рдЗрд╕реЗ рдкрд╣рд▓реЗ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рдЬрд╛рд░реА рдХрд┐рдпрд╛ рддрд╛рдХрд┐ рдЗрд╕рдХреА рд╕реБрд░рдХреНрд╖рд╛ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рд╣реЛ рд╕рдХреЗ, рдлрд┐рд░ рдЗрд╕рдХреЗ frontier-defining capabilities рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЗрд╕реЗ рд╕рд╢реБрд▓реНрдХ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рд▓рд╛рдпрд╛ рдЧрдпрд╛ред

 

 

OpenAI рдХреЗ рдЕрдиреНрдп рдореЙрдбрд▓реЛрдВ рдХреА рддреБрд▓рдирд╛

O3, OpenAI рдХреА GPT рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рд╕рд╛рде рдЦрдбрд╝рд╛ рд╣реИ рд▓реЗрдХрд┐рди рдЗрд╕рдХрд╛ рдзреНрдпрд╛рди рдЕрд▓рдЧ рд╣реИред

рдкреВрд░реНрд╡рд╡рд░реНрддреА ChatGPT рдореЙрдбрд▓ (рдЬреИрд╕реЗ GPT-4, GPT-4.1 рдЖрджрд┐) рдмрдбрд╝реЗ рдкреНрд░реА-рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рдЖрдВрддрд░рд┐рдХ chain-of-thought рдирд╣реАрдВ рд╣реЛрддрд╛ (тАЬрд╡реЗ рдЙрддреНрддрд░ рджреЗрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рд╕реЛрдЪрддреЗ рдирд╣реАрдВ рд╣реИрдВтАЭ)ред

GPT-4.5 (рдлрд╝рд░рд╡рд░реА 2025) рдПрдХ рдЕрддреНрдпрдВрдд рдмрдбрд╝рд╛, рд╕рд╛рдорд╛рдиреНрдп-рдЙрджреНрджреЗрд╢реНрдп рднрд╛рд╖рд╛ рдореЙрдбрд▓ рд╣реИ рдЬрд┐рд╕реЗ рд╡реНрдпрд╛рдкрдХ рднрд╛рд╖рд╛ рд╕рдордЭ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

GPT-4.5 рдореЗрдВ рд╕реВрдХреНрд╖реНрдорддрд╛ рдФрд░ рд░рдЪрдирд╛рддреНрдордХрддрд╛ (рдЙрдЪреНрдЪ рднрд╛рд╡рдирд╛рддреНрдордХ тАЬEQтАЭ) рдореЗрдВ рд╕реБрдзрд╛рд░ рджреЗрдЦрд╛ рдЧрдпрд╛ рд╣реИ, рд▓реЗрдХрд┐рди OpenAI рдЗрд╕реЗ GPT-4 рдкрд░ рдПрдХ рдХреНрд░рдорд┐рдХ (incremental) рдЙрдиреНрдирдпрди рдорд╛рдирддрд╛ рд╣реИред

O3 рдХреЗ рд╡рд┐рдкрд░реАрдд, GPT-4.5 рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ рдХреНрд░рдорд┐рдХ рдпреЛрдЬрдирд╛ рдирд╣реАрдВ рдмрдирд╛рддрд╛; рдЗрд╕рдХреЗ рдмрдЬрд╛рдп рдпрд╣ рдкреНрд░рджрд░реНрд╢рди рд╕реБрдзрд╛рд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреИрдорд╛рдиреЗ рдФрд░ рдлрд╛рдЗрди-рдЯреНрдпреВрдирд┐рдВрдЧ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред

OpenAI рдпрд╣ рдиреЛрдЯ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЬреИрд╕реЗ-рдЬреИрд╕реЗ рд╕рд╛рдорд╛рдиреНрдп рдмреБрджреНрдзрд┐рдорддреНрддрд╛ (general intelligence) рдмрдврд╝рддреА рд╣реИ, рдпрд╣ рдПрдЬреЗрдВрдЯрд┐рдХ рдореЙрдбрд▓реЛрдВ рдореЗрдВ рддрд░реНрдХ рдХреА рдиреАрдВрд╡ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдп рдХрд░ рд╕рдХрддреА рд╣реИред

рд╡рд╛рд╕реНрддрд╡рд┐рдХрддрд╛ рдореЗрдВ, GPT-4.5 рд╕рдВрд╡рд╛рджрд╛рддреНрдордХ рдХрд╛рд░реНрдпреЛрдВ рдФрд░ рд░рдЪрдирд╛рддреНрдордХ рд▓реЗрдЦрди рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯрддрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИ: рдпрд╣ тАЬрд╡рд┐рдЪрд╛рд░реЛрдВ рдХреЛ рд╕реНрд╡рд╛рднрд╛рд╡рд┐рдХ рд░реВрдк рд╕реЗ рдЬреЛрдбрд╝рддрд╛ рд╣реИтАЭ рдФрд░ рдЕрдзрд┐рдХ рдЗрдВрдЯрд░реИрдХреНрд╢рди рдЖрдордВрддреНрд░рд┐рдд рдХрд░рддрд╛ рд╣реИ (рдЯреНрдпреВрдЯрд░рд┐рдВрдЧ, рд╡рд┐рдЪрд╛рд░-рд╡рд┐рдорд░реНрд╢, рд▓реЗрдЦрди рд╕рд╣рд╛рдпрддрд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд)ред

рдЗрд╕рдХреЗ рд╡рд┐рдкрд░реАрдд, O3 рд╡рд┐рд╢реНрд▓реЗрд╖рдгрд╛рддреНрдордХ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдХреВрд▓рд┐рдд рд╣реИ: рд╕рдореАрдХрд░рдг рд╣рд▓ рдХрд░рдирд╛, рдХреЛрдбрд┐рдВрдЧ, рдмрд╣реБ-рдЪрд░рдгреАрдп рдкреНрд░рд╢реНрди рд╣рд▓ рдХрд░рдирд╛ред

рд╕рдореАрдХреНрд╖рдХ рдпрд╣ рдкрд╛рддреЗ рд╣реИрдВ рдХрд┐ O3 рдФрд░ GPT-4.5 рдПрдХ-рджреВрд╕рд░реЗ рдХреЗ рдкреВрд░рдХ рд╣реИрдВ тАУ рдПрдХ тАЬрдмреБрджреНрдзрд┐рдорд╛рди рдорд┐рддреНрд░тАЭ рд╣реИ рддрд░реНрдХ рдХреЗ рд▓рд┐рдП, рджреВрд╕рд░рд╛ тАЬрд╕рд╣рдпреЛрдЧреА рд╕рд╛рдереАтАЭ рд╣реИ рд╕рд╛рдорд╛рдиреНрдп рд╕рдВрд╡рд╛рдж рдХреЗ рд▓рд┐рдПред

рдХрдИ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЛ GPT-4.5 рдЕрдзрд┐рдХ рдкреНрд░рд╡рд╛рд╣реА рдФрд░ рдХрдо рд╕рддрд░реНрдХ рд▓рдЧрддрд╛ рд╣реИ, рдЬрдмрдХрд┐ O3 рдЕрдзрд┐рдХ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдФрд░ рддрдереНрдпреЛрдВ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реЛрддрд╛ рд╣реИ (рдЬрдм рддрдХ рдХрд┐ рдпрд╣ рднреНрд░рдо рди рдЙрддреНрдкрдиреНрди рдХрд░реЗ, рдЬреИрд╕рд╛ рдХрд┐ рд╣рд╛рд▓рд┐рдпрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгреЛрдВ рдореЗрдВ рджреЗрдЦрд╛ рдЧрдпрд╛)ред

OpenAI рдПрдХ рдкрджрд╛рдиреБрдХреНрд░рдо рднреА рдкреНрд░рд╕реНрддреБрдд рдХрд░рддрд╛ рд╣реИ: ChatGPT рдХрд┐рд╕реА рдХреНрд╡реЗрд░реА рдХреЗ рдЕрдиреБрд╕рд╛рд░ GPT-4.5 рдпрд╛ O3 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИред

2025 рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ, O3 рдХреЛ тАЬрдЕрдм рддрдХ рдХрд╛ рд╕рдмрд╕реЗ рд╕реНрдорд╛рд░реНрдЯ рдореЙрдбрд▓тАЭ рдХреЗ рд░реВрдк рдореЗрдВ рд╕реНрдерд╛рдирд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ рдЬрдЯрд┐рд▓ рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рд▓рд┐рдП, рдЬрдмрдХрд┐ GPT-4.5 (рдХреЛрдб рдирд╛рдо тАЬOrionтАЭ) рдХреЛ рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рдЕрди-рд╕реБрдкрд░рд╡рд╛рдЗрдЬрд╝реНрдб рдореЙрдбрд▓ рдХрд╣рд╛ рдЧрдпрд╛ред

рдЕрдВрддрддрдГ, рджреЛрдиреЛрдВ рдореЗрдВ рд╕реЗ рдХреЛрдИ рднреА рдкреВрд░реА рддрд░рд╣ рд╕реЗ рджреВрд╕рд░реЗ рдХреЛ рдкреНрд░рддрд┐рд╕реНрдерд╛рдкрд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛: O3, GPT-4.5 рдХрд╛ рд╡рд┐рдХрд▓реНрдк рдирд╣реАрдВ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдорд╣рдБрдЧрд╛ (рдЕрдзрд┐рдХ рд╡рд┐рд▓рдВрдмрддрд╛) рдФрд░ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╣реИ, рдФрд░ GPT-4.5 рдПрдХ рддрд░реНрдХ рдореЙрдбрд▓ рдирд╣реАрдВ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдЗрд╕рдореЗрдВ рдЕрдВрддрд░реНрдирд┐рд╣рд┐рдд chain-of-thought рдХреА рдХрдореА рд╣реИред

 

рдЕрдиреНрдп рдкреНрд░рдореБрдЦ рдореЙрдбрд▓реЛрдВ рд╕реЗ рддреБрд▓рдирд╛

OpenAI O3 рдХреЛ 2025 рдореЗрдВ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрд▓рдмреНрдз рд╕рд░реНрд╡реЛрддреНрддрдо AI рдореЙрдбрд▓реЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ рдорд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдХреИрд╕рд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ?

Anthropic Claude 4 (Opus рдФрд░ Sonnet):

Claude Opus 4 (рдордИ 2025) рдХреЛ тАЬрджреБрдирд┐рдпрд╛ рдХрд╛ рд╕рд░реНрд╡рд╢реНрд░реЗрд╖реНрда рдХреЛрдбрд┐рдВрдЧ рдореЙрдбрд▓тАЭ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИред

рдпрд╣ SWE-Bench Verified рдкрд░ ~72.5% рд╕реНрдХреЛрд░ рдХрд░рддрд╛ рд╣реИ (рд╕рд░реНрд╡реЛрддреНрддрдо рд╢реНрд░реЗрдгреА рдореЗрдВ) рдФрд░ рдЬрдЯрд┐рд▓ рдХреЛрдбрд┐рдВрдЧ рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдШрдВрдЯреЛрдВ рддрдХ рдирд┐рд░рдВрддрд░ рдХрд╛рдо рдХрд░ рд╕рдХрддрд╛ рд╣реИред

Claude Sonnet 4 (рдЫреЛрдЯрд╛ рд╕рдВрд╕реНрдХрд░рдг) рднреА ~72.7% рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИред

рд╕рд┐рд░-рд╕реЗ-рд╕рд┐рд░ рдХреЛрдбрд┐рдВрдЧ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдореЗрдВ, O3 (~71.7%) рд▓рдЧрднрдЧ рдмрд░рд╛рдмрд░ рд╣реИред

Claude рдХреЗ рдореЙрдбрд▓реЛрдВ рдореЗрдВ extended memory (рд╕реЗрд╢рди рдХреЗ рдмреАрдЪ рддрдереНрдпреЛрдВ рдХреЛ рдпрд╛рдж рд░рдЦрдиреЗ) рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдЯреВрд▓ рдЙрдкрдпреЛрдЧ рдЬреИрд╕реА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ рднреА рд╣реИрдВред

рдХреБрд▓ рдорд┐рд▓рд╛рдХрд░, Claude 4 рдФрд░ O3 рдХреНрд╖рдорддрд╛рдУрдВ рдореЗрдВ рдХрд╛рдлрд╝реА рддреБрд▓рдиреАрдп рд╣реИрдВ: рд▓рдВрдмреЗ рдХреЛрдбрд┐рдВрдЧ рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ Claude рдереЛрдбрд╝реА рдмрдврд╝рдд рд░рдЦ рд╕рдХрддрд╛ рд╣реИ, рдЬрдмрдХрд┐ рдЧрдгрд┐рдд/рд╡рд┐рд╢реНрд▓реЗрд╖рдгрд╛рддреНрдордХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЗрдВ O3 рдЕрдХреНрд╕рд░ рдЖрдЧреЗ рд░рд╣рддрд╛ рд╣реИред

Anthropic рдХрд╛ рджрд╛рд╡рд╛ рд╣реИ рдХрд┐ Opus 4 тАЬрдХреЛрдбрд┐рдВрдЧ, рд╢реЛрдз, рд▓реЗрдЦрди рдФрд░ рд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЦреЛрдЬтАЭ рдореЗрдВ рд╕реАрдорд╛рдУрдВ рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рддрд╛ рд╣реИ тАФ рдЬреЛ O3 рдХреА рдорд╣рддреНрд╡рд╛рдХрд╛рдВрдХреНрд╖рд╛рдУрдВ рдХреЗ рд╕рдорд╛рди рд╣реИред

 

Google Gemini 2.5:

Google рдХрд╛ Gemini 2.5 Pro (рдорд╛рд░реНрдЪ 2025) рдПрдХ рдмрд╣реБ-рдорд╛рдзреНрдпрдо рдореЗрдЧрд╛-рдореЙрдбрд▓ рд╣реИ рдЬрд┐рд╕рдореЗрдВ 1тАУ2 рдорд┐рд▓рд┐рдпрди рдЯреЛрдХрди рдХреЙрдиреНрдЯреЗрдХреНрд╕реНрдЯ рд╣реИред

Google рдХреЗ рдЕрдиреБрд╕рд╛рд░, рдпрд╣ тАЬрддрд░реНрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ рдореЗрдВ рд╢реАрд░реНрд╖ рдкрд░тАЭ рд╣реИ: рд╡рд┐рд╢реЗрд╖ рддрдХрдиреАрдХреЛрдВ рдХреЗ рдмрд┐рдирд╛ рднреА Gemini 2.5 Pro рдиреЗ GPQA рдФрд░ AIME 2025 рдЬреИрд╕реЗ рдЧрдгрд┐рдд рдФрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ рдЕрдЧреНрд░рдгреА рд╕реНрдХреЛрд░ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдПред

рдХреЛрдбрд┐рдВрдЧ рдХреЗ рд▓рд┐рдП, Google рдХрд╛ рд░рд┐рдкреЛрд░реНрдЯреЗрдб рд╕реНрдХреЛрд░ SWE-Bench Verified рдкрд░ 63.8% рд╣реИред

рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ, O3 рдХреБрдЫ рд╢реБрджреНрдз рддрд░реНрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХреНрд╕ (рдЬреИрд╕реЗ AIME рдФрд░ GPQA) рдореЗрдВ Gemini 2.5 Pro рд╕реЗ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди Gemini рд╡реНрдпрд╛рдкрдХ рдХреНрд╖рдорддрд╛рдПрдБ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ: рдпрд╣ рдореВрд▓ рд░реВрдк рд╕реЗ рдкрд╛рда, рдЫрд╡рд┐рдпрд╛рдБ, рдСрдбрд┐рдпреЛ, рдФрд░ рд╡реАрдбрд┐рдпреЛ рдХреЛ рд╕рдВрднрд╛рд▓ рд╕рдХрддрд╛ рд╣реИ, рдФрд░ рдЗрд╕рдХрд╛ рд╡рд┐рд╢рд╛рд▓ рдХреЙрдиреНрдЯреЗрдХреНрд╕реНрдЯ рдмрдбрд╝реЗ рджрд╕реНрддрд╛рд╡реЗрдЬрд╝реЛрдВ рдпрд╛ рдХреЛрдбрдмреЗрд╕ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдХреВрд▓ рд╣реИред

Gemini рдХреА рддрд╛рдХрдд рд╣реИ рдорд▓реНрдЯреАрдореЙрдбрд▓ рдЗрдВрдЯреАрдЧреНрд░реЗрд╢рди рдФрд░ рд░рдЪрдирд╛рддреНрдордХ рддрд░реНрдХ, рдЬрдмрдХрд┐ O3 рдЕрдзрд┐рдХ рд╕рдВрдХреБрдЪрд┐рдд рдФрд░ рдХрд┐рдлрд╝рд╛рдпрддреА рд╣реИред

 

Mistral AI:

рдлреНрд░рд╛рдВрд╕реАрд╕реА рд╕реНрдЯрд╛рд░реНрдЯрдЕрдк Mistral рдиреЗ Mistral Large 2 рдФрд░ Medium 3 рдЬреИрд╕реЗ рдореЙрдбрд▓ (2025 рдХреА рд╢реБрд░реБрдЖрдд/рдордзреНрдп рдореЗрдВ) рдЬрд╛рд░реА рдХрд┐рдП рд╣реИрдВред

Mistral Medium 3 рдХреЛ рдХреЛрдбрд┐рдВрдЧ/STEM рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рджрдХреНрд╖рддрд╛ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдпреЗ рдореЙрдбрд▓ рдЕрдЪреНрдЫрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдУрдкрди-рд╕реЛрд░реНрд╕ рд╣реИрдВ, рд▓реЗрдХрд┐рди 2025 рдХреЗ рдордзреНрдп рддрдХ рдЗрдиреНрд╣реЛрдВрдиреЗ O3, GPT-4.5 рдпрд╛ Claude 4 рдЬреИрд╕реЗ рдЯреЙрдк рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдкрд╛рд░ рдирд╣реАрдВ рдХрд┐рдП рд╣реИрдВред

(рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, GPT-4.1 рдФрд░ GPT-4.5 рдХрдИ рдЕрдХрд╛рджрдорд┐рдХ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ рдЕрднреА рднреА state-of-the-art рд╣реИрдВред)

Mistral рдХреА рдкреНрд░рдореБрдЦ рд╡рд┐рд╢реЗрд╖рддрд╛ рд╣реИ рдУрдкрди рд▓рд╛рдЗрд╕реЗрдВрд╕рд┐рдВрдЧ рдФрд░ рддреЗрдЬрд╝ рдирд╡рд╛рдЪрд╛рд░ рдЧрддрд┐, рди рдХрд┐ рд╕реАрдзреЗ тАЬрдлреНрд░рдВрдЯрд┐рдпрд░тАЭ рдкреНрд░рджрд░реНрд╢рдиред

 

xAI Grok 3:

рдПрд▓рди рдорд╕реНрдХ рдХреА рдХрдВрдкрдиреА xAI рдиреЗ рдлрд░рд╡рд░реА 2025 рдореЗрдВ Grok 3 рдХреА рдШреЛрд╖рдгрд╛ рдХреАред

O3 рдХреА рддрд░рд╣, Grok 3 рдПрдХ chain-of-thought рдореЙрдбрд▓ рд╣реИ рдЬрд┐рд╕реЗ рд╡рд┐рд╢рд╛рд▓ Colossus рд╕реБрдкрд░рдХрдВрдкреНрдпреВрдЯрд░ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ, Grok 3 рдиреЗ 2025 AIME рдореЗрдВ ~93.3% рдФрд░ GPQA рдореЗрдВ 84.6% рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ тАФ рдЬреЛ O3 рд╕реЗ рдереЛрдбрд╝рд╛ рдиреАрдЪреЗ рд╣реИрдВред

рдорд╕реНрдХ рдиреЗ рдпрд╣ рд░реЗрдЦрд╛рдВрдХрд┐рдд рдХрд┐рдпрд╛ рдХрд┐ Grok рдХрд╛ chain-of-thought рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рдкреВрд░реНрдгрддрдГ рджрд┐рдЦрд╛рдИ рджреЗрддрд╛ рд╣реИ (тАЬThinkтАЭ рдореЛрдб рд╣реИ), рдЬрдмрдХрд┐ O3 рдХрд╛ рддрд░реНрдХ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ рдЫрд┐рдкрд╛ рд╣реЛрддрд╛ рд╣реИред

рдмреНрд▓рд╛рдЗрдВрдб A/B рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ, рдкреНрд░рд╛рд░рдВрднрд┐рдХ Grok 3 рдиреЗ рдХрдерд┐рдд рд░реВрдк рд╕реЗ O3 рдФрд░ рдЕрдиреНрдп рдореЙрдбрд▓реЛрдВ рдХреЛ рд╕рдордЧреНрд░ рдкрд╕рдВрдж рдХреЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдкреАрдЫреЗ рдЫреЛрдбрд╝ рджрд┐рдпрд╛ (рдХрдо рд╕реЗ рдХрдо xAI рдХреЗ рдЕрдкрдиреЗ Chatbot Arena рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ)ред

Grok 3 рдФрд░ O3 рдХреЛ рд╕рд╛рдорд╛рдиреНрдпрддрдГ рддреБрд▓рдиреАрдп рдорд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ: рджреЛрдиреЛрдВ рд╕рдВрд░рдЪрд┐рдд рддрд░реНрдХ рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рд╣реИрдВ, рдХреЗрд╡рд▓ рд╕рдорд╛рдзрд╛рди рд╢реИрд▓реА рдореЗрдВ рдорд╛рдореВрд▓реА рдЕрдВрддрд░ рд╣реИрдВред

 

рд╕рд╛рд░рд╛рдВрд╢

O3 рдХреЛ рдЖрдо рддреМрд░ рдкрд░ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрд▓рдмреНрдз рд╕рдмрд╕реЗ рдЙрдиреНрдирдд рдореЙрдбрд▓реЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ рдорд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ тАФ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рд╡рд┐рд╢реНрд▓реЗрд╖рдгрд╛рддреНрдордХ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдПред

рдпрд╣ рдЕрдХреНрд╕рд░ рдкреБрд░рд╛рдиреЗ GPT рдФрд░ Claude 3.7 рдореЙрдбрд▓реЛрдВ рдХреЛ рдкреНрд░рдореБрдЦ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдореЗрдВ рдкреАрдЫреЗ рдЫреЛрдбрд╝рддрд╛ рд╣реИред

рд╣рд╛рд▓рд┐рдпрд╛ рдореЙрдбрд▓реНрд╕ (Claude 4, Gemini 2.5, Grok 3) рдЕрдкрдиреА-рдЕрдкрдиреА рддрд╛рдХрдд рд▓рд╛рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди 2025 рддрдХ рдХреЛрдИ рднреА рдореЙрдбрд▓ O3 рдХреЛ рд╣рд░ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдкрд╛рд░ рдирд╣реАрдВ рдХрд░ рдкрд╛рдпрд╛ рд╣реИред

(рдЯрд╛рдпрд▓рд░ рдХреЛрд╡реЗрди рдиреЗ рдпрд╣рд╛рдВ рддрдХ рдХрд╣рд╛ рдХрд┐ O3 тАЬAGI рдХреЗ рдЖрдЧрдорди рдХреА рдШреЛрд╖рдгрд╛ рдХрд░рддрд╛ рд╣реИ,тАЭ рд╣рд╛рд▓рд╛рдВрдХрд┐ рдЕрдзрд┐рдХрд╛рдВрд╢ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рдЗрд╕ рджрд╛рд╡реЗ рд╕реЗ рд╕рд╣рдордд рдирд╣реАрдВ рд╣реИрдВред)

 

рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдФрд░ рдЙрдкрдпреЛрдЧ рдХреЗ рдХреНрд╖реЗрддреНрд░

O3 рдХреЛ рдЬрдЯрд┐рд▓ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдЪреНрдЪ-рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рд╕рд╣рд╛рдпрдХ рдХреЗ рд░реВрдк рдореЗрдВ рдбрд┐рдЬрд╝рд╛рдЗрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдпрд╣ ChatGPT Plus/Pro рдЧреНрд░рд╛рд╣рдХреЛрдВ рдФрд░ API рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ (рдПрдХ тАЬreasoningтАЭ рдореЙрдбрд▓ рд╡рд┐рдХрд▓реНрдк рдХреЗ рд░реВрдк рдореЗрдВ) рдЙрдкрд▓рдмреНрдз рд╣реИред

рдЗрд╕рдХреЗ рдкреНрд░рдореБрдЦ рдЙрдкрдпреЛрдЧ рдХреЗ рдХреНрд╖реЗрддреНрд░ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

STEM рд╢рд┐рдХреНрд╖рд╛ рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди:

рдХрдард┐рди рдЧрдгрд┐рдд рдФрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдХреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рдЪрд░рдг-рджрд░-рдЪрд░рдг рд╣рд▓ рдХрд░рдирд╛, рдпрд╛ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдХреА рд╕рд╣рд╛рдпрддрд╛ рдХрд░рдирд╛ рдЬреИрд╕реЗ рдХрд┐ рд╕рд╛рд╣рд┐рддреНрдп рдФрд░ рдбреЗрдЯрд╛ рдХреЛ рдЫрд╛рдВрдЯрдирд╛ (рдЬреИрд╕реЗ ChatGPT Deep Research рдПрдЬреЗрдВрдЯ рдореЗрдВ)ред

рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рд╡рд┐рдХрд╛рд╕:

рдЬреЛрдбрд╝реА-рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдФрд░ рдбреАрдмрдЧрд┐рдВрдЧред O3 рдХреА рдХреЛрдбрд┐рдВрдЧ рдХреНрд╖рдорддрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдбреЗрд╡рд▓рдкрд░ рдЯреВрд▓реНрд╕ (рдЬреИрд╕реЗ GitHub Copilot рдПрдХреАрдХрд░рдг) рдореЗрдВ рд╣реЛрддрд╛ рд╣реИред

рдпрд╣ рдмрд╣реБ-рдлрд╝рд╛рдЗрд▓ рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдХреЛ рд╕рдВрднрд╛рд▓ рд╕рдХрддрд╛ рд╣реИ рдФрд░ рд▓рдВрдмреЗ рд╕рддреНрд░реЛрдВ рдореЗрдВ рд╕рдВрджрд░реНрдн рдмрдирд╛рдП рд░рдЦ рд╕рдХрддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдФрд░ рдкреБрдирд░реНрдЧрдарди рдореЗрдВ рдорджрдж рдорд┐рд▓рддреА рд╣реИред

рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг:

рдбреЗрдЯрд╛ рдХреЛрдб рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд▓рд╛рдХрд░ рдЧреНрд░рд╛рдлрд╝ рдмрдирд╛рдирд╛ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдирд╛ред

рдЗрд╕рдХреА рдмрд╣реБ-рдорд╛рдзреНрдпрдо рджреГрд╖реНрдЯрд┐ рдЗрд╕реЗ рд╕реНрдХреНрд░реАрдирд╢реЙрдЯреНрд╕ рд╕реЗ рдЪрд╛рд░реНрдЯ рдпрд╛ рдЖрд░реЗрдЦ рдкрдврд╝рдиреЗ рдФрд░ рдЙрдиреНрд╣реЗрдВ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдмрдирд╛рддреА рд╣реИред

рд░рдЪрдирд╛рддреНрдордХ/рдкрд░рд╛рдорд░реНрд╢ рдХрд╛рд░реНрдп:

рд╢реБрджреНрдз STEM рд╕реЗ рдмрд╛рд╣рд░ рднреА, O3 рддрдХрдиреАрдХреА рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рд░рдгрдиреАрддрд┐ рдпрд╛ рд╡рд┐рдЪрд╛рд░-рдордВрдерди рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд╣рд╛рдБ рдпрд╣ рд╡рд┐рдЪрд╛рд░ рдЙрддреНрдкрдиреНрди рдХрд░ рд╕рдХрддрд╛ рд╣реИ рдФрд░ рдлрд┐рд░ рдЙрдирдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░ рд╕рдХрддрд╛ рд╣реИред

рдЗрд╕рдХреА тАЬрд╡рд┐рдЪрд╛рд░рд╢реАрд▓тАЭ рд╢реИрд▓реА рдЗрд╕реЗ рдПрдХ рдкреНрд░рдХрд╛рд░ рдХрд╛ рд╡рд░реНрдЪреБрдЕрд▓ рд╕рд▓рд╛рд╣рдХрд╛рд░ рдмрдирд╛ рджреЗрддреА рд╣реИред

рдХреБрд▓ рдорд┐рд▓рд╛рдХрд░, O3 рдХреА рдЧрд╣рд░реА рддрд░реНрдХ, рдЯреВрд▓ рдЙрдкрдпреЛрдЧ, рдФрд░ рдорд▓реНрдЯреАрдореЙрдбрд▓ рд╕рдордЭ рдХреА рдЕрдиреВрдареА рд╕рдВрдпреЛрдЬрдирд╛ рдРрд╕реЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рд░рд╛рд╕реНрддрд╛ рдЦреЛрд▓рддреА рд╣реИ рдЬреЛ рдкреВрд░реНрд╡-2025 AI рдореЙрдбрд▓реНрд╕ рдХреЗ рд▓рд┐рдП рдХрдард┐рди рдереЗред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдХреЛрдИ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдПрдХ рдкрд╛рдареНрдпрдкреБрд╕реНрддрдХ рд╕рдорд╕реНрдпрд╛ рдХреА рддрд╕реНрд╡реАрд░ рдЦреАрдВрдЪ рд╕рдХрддрд╛ рд╣реИ рдФрд░ ChatGPT-O3 рди рдХреЗрд╡рд▓ рдЙрд╕реЗ рдкрдврд╝реЗрдЧрд╛, рдмрд▓реНрдХрд┐ рдЪрд░рдг-рджрд░-рдЪрд░рдг рдЙрд╕реЗ рд╣рд▓ рдХрд░реЗрдЧрд╛ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░реЗрдЧрд╛ тАФ рдЬреЛ рдкрд╣рд▓реЗ рд╕рдВрднрд╡ рдирд╣реАрдВ рдерд╛ред

 

  1. ┬аFAQs (рдкреНрд░рд╢реНрди рдФрд░ рдЙрддреНрддрд░)

Q1: OpenAI O3 рдореЙрдбрд▓ рдХреНрдпрд╛ рд╣реИ?
A1: OpenAI O3 рдПрдХ reasoning-optimized рдмрдбрд╝рд╛ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рд╣реИ, рдЬрд┐рд╕реЗ 2025 рдореЗрдВ рд░рд┐рд▓реАрдЬрд╝ рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдпрд╣ рдЧрд╣рд░рд╛рдИ рд╕реЗ рд╕реЛрдЪрдиреЗ рдФрд░ рдЬрдЯрд┐рд▓ рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбрд┐рдЬрд╝рд╛рдЗрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

 

Q2: O3 рдореЙрдбрд▓ GPT-4.5 рд╕реЗ рдХреИрд╕реЗ рдЕрд▓рдЧ рд╣реИ?
A2: GPT-4.5 рд╕рд╛рдорд╛рдиреНрдп рднрд╛рд╖рд╛ рд╕рдордЭ рдореЗрдВ рдорд╛рд╣рд┐рд░ рд╣реИ, рдЬрдмрдХрд┐ O3 рд╡рд┐рд╢реНрд▓реЗрд╖рдгрд╛рддреНрдордХ рдФрд░ рдорд▓реНрдЯреАрд╕реНрдЯреЗрдк рд▓реЙрдЬрд┐рдХ рдЯрд╛рд╕реНрдХ рдХреЗ рд▓рд┐рдП рдЦрд╛рд╕ рд╣реИ, рдЬреЛ chain-of-thought reasoning рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред

 

Q3: O3 рдореЙрдбрд▓ рдХреЗ рдкреНрд░рдореБрдЦ рдЙрдкрдпреЛрдЧ рдХреНрдпрд╛ рд╣реИрдВ?
A3: O3 рдХрд╛ рдЙрдкрдпреЛрдЧ STEM рд╢рд┐рдХреНрд╖рд╛, рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг,рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░ рдХреЗ рд╡рд┐рдХрд╛рд╕┬ардФрд░ рддрдХрдиреАрдХреА рд╕рд▓рд╛рд╣ рджреЗрдиреЗ рдореЗрдВ рд╣реЛрддрд╛ рд╣реИред

 

Q4: рдХреНрдпрд╛ O3 рдореЙрдбрд▓ multimodal рд╣реИ?
A4: рд╣рд╛рдБ, O3 рдореЙрдбрд▓ рд╡рд┐рдЬреБрдЕрд▓ рдЪреЗрди-рдСрдлрд╝-рдереЙрдЯ рддрдХрдиреАрдХ рдХреЗ рд╕рд╛рде рддрд╕реНрд╡реАрд░реЛрдВ рдХреЛ рд╕рдордЭ рд╕рдХрддрд╛ рд╣реИ рдФрд░ рдЙрдирдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░ рд╕рдХрддрд╛ рд╣реИред

 

Q5: O3 рдореЙрдбрд▓ рд╕реБрд░рдХреНрд╖рд┐рдд рдХреИрд╕реЗ рд╣реИ?
A5: O3 рдореЗрдВ deliberative alignment рддрдХрдиреАрдХ рд╣реИ рдЬреЛ рд╕реБрд░рдХреНрд╖рд╛ рдиреАрддрд┐рдпреЛрдВ рдХреЛ reasoning рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдХрд░рддреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рдЙрддреНрддрд░ рджреЗрддрд╛ рд╣реИред

1 COMMENTS

LEAVE A RESPONSE

Your email address will not be published. Required fields are marked *

I am a technology lover and want to spread my AI related knowledge to this beautiful world.