Ответ на пост «Вот это поворот»2
Простым языком от самой модели:
то, чего не делают крупные модели - думает над ответов перед его отправкой, заранее обдумывая возможные ошибки в ответе
И объяснение вариантов модели (8b, 14b, 671b) (количество миллиардов параметров)
И добивочка к вопросам о том, почему на сайте DeepSeek модель даёт довольно тупые ответы и многие не понимают чем все вокруг восхищаются.
На самом деле у них на сайте просто не модель с 671b, а одна из мелких, но какая именно - она не знает, потому что она мелкая и у неё недостаточно знаний, чтобы это понять










