27.01.2025, 17:25 41016

Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете

Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT
Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете
Фото: Depositphotos
Чат-бот китайской компании DeepSeek предлагает поиск данных в интернете без специальной подписки, сообщает РБК.

В ноябре 2024 года китайская компания DeepSeek открыла доступ к большой языковой модели DeepSeek V3. Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT, а основатели компании и вовсе нацелились на создание "сверхразумного" ИИ.

Что такое DeepSeek V3

DeepSeek V3 - это большая языковая модель с открытым исходным кодом, которая содержит 671 млрд параметров и обучена на 14,8 трлн токенов. Она способна анализировать тексты, делать переводы и писать эссе, а также создавать код.

Особенности модели кроются в ее архитектуре и методах обучения.

Она использует:

  • архитектуру Multi-token Prediction. Это позволяет модели предсказывать несколько слов вместо одного, анализируя одновременно разные части предложения. Такой метод повышает точность работы модели и ее производительность;
  • mixture of Experts. Эта архитектура использует несколько специализированных и заранее обученных нейросетей-"экспертов" для анализа различных входных данных. Это позволяет ускорить обучение и повысить эффективность ИИ. DeepSeek V3 работает с 256 такими нейросетями, из которых восемь активируются для обработки каждого токена;
  • технологию Multi-head Latent Attention - механизм внимания, который обычно используется в больших языковых моделях и помогает им идентифицировать наиболее важные части предложения. MLA позволяет извлекать ключевые детали из фрагмента текста несколько раз, а не только один. Это означает, что ИИ с меньшей вероятностью упустит важную информацию.

Благодаря этим особенностям модель потребовала всего 2,788 млн часов или два месяца работы графических процессоров Nvidia H800 для обучения. Затраты на него составили $5,5 млн. Для сравнения - OpenAI потратила на обучение GPT $78 млн.

Разработчики утверждают, что в тестах нейросеть превзошла GPT-4о от OpenAI, Llama 3 от Meta и Claude 3.5 Sonnet от Anthropic в задачах программирования и обработки текста.

Главная особенность новой модели - это полностью открытый код, который позволяет разработчикам не только использовать технологию для коммерческих целей, но и адаптировать ее для решения различных задач в сфере искусственного интеллекта.

Возможности DeepSeek V3

Модель предлагает контекстное окно в 128 тыс. токенов, как и GPT-4o, что позволяет ей анализировать до 300 страниц текста.

Она способна:

  • генерировать тексты разных объемов и в разных жанрах;
  • искать информацию в интернете;
  • расшифровывать диаграммы и объяснять картинки;
  • писать код, корректно форматировать его и решать сложные задачи по программированию на языках C++, Go, Java, JavaScript, Python и Rust. Модель успешно интегрируется с редакторами кода;
  • рассуждать подобно GPT-o1 и o1-mini в режиме DeepThink.

DeepSeek V3 предлагает мультиязычность высокого уровня, а ее глубокое понимание китайского и английского позволяет работать с текстами без потери качества переводенного текста и смысла. Модель также поддерживает русский язык.

Минус нейросети в том, что пока она не позволяет анализировать материалы по ссылкам, а поддерживает только загрузки или выдержки из текстов.

Как пользоваться DeepSeek V3

DeepSeek предлагает несколько вариантов доступа, в том числе через открытые модели на Hugging Face, бесплатную версию на собственном сайте с контекстным окном до 32 тыс. токенов, API для коммерческого использования, локальное развертывание и мобильные приложения для iOS и Android. При выходе DeepSeek-R1 пользователям было доступно 50 бесплатных запросов в день, сейчас ограничения на сайте не указаны.

Как воспользоваться бесплатной версией на сайте

Пользователи могут получить доступ к DeepSeek V3 через сайт.

Для этого нужно:

  • перейти на сайт DeepSeek, нажать Start Now;
  • пройти регистрацию;
  • откроется диалоговое окно с чат-ботом. В нем, помимо обычного ответа, можно выбрать опцию DeepThink для рассуждений или Search для поиска данных в Интернете. Также для анализа можно прикрепить до 50 файлов разного формата размером до 100 МБ каждый.

Как воспользоваться мобильным приложением

В декабре 2024 года DeepSeek выпустила бесплатное мобильное приложение для своего чат-бота. Оно доступно в российских магазинах App Store и Google Play. Также приложение можно скачать с сайта разработчиков, выбрав Get DeepSeek App и просканировав QR-код.

После установки и открытия приложения нужно нажать Agree, чтобы согласиться с условиями его использования, пройти регистрацию, после чего появится диалоговое окно с чат-ботом.
 
Нашли ошибку в тексте?

Выделите ошибку и одновременно нажмите Ctrl + Enter


Если Вы располагаете информацией по теме данного материала, отправляйте нам видео или новости на почту.

новости по теме

Читаемое

Новости RT

    Новости Китая

      Ваше мнение

      В Алматы планируют снести историческое здание по улице Досмухамедова, в котором сейчас располагается интернат для одаренных в спорте детей. Здание получило мировое признание и вошло в каталог конструктивизма. Считаете ли вы необходимым снос здания?