27.01.2025, 17:25 16141

Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете

Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT
Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете
Фото: Depositphotos
Чат-бот китайской компании DeepSeek предлагает поиск данных в интернете без специальной подписки, сообщает РБК.

В ноябре 2024 года китайская компания DeepSeek открыла доступ к большой языковой модели DeepSeek V3. Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT, а основатели компании и вовсе нацелились на создание "сверхразумного" ИИ.

Что такое DeepSeek V3

DeepSeek V3 - это большая языковая модель с открытым исходным кодом, которая содержит 671 млрд параметров и обучена на 14,8 трлн токенов. Она способна анализировать тексты, делать переводы и писать эссе, а также создавать код.

Особенности модели кроются в ее архитектуре и методах обучения.

Она использует:

  • архитектуру Multi-token Prediction. Это позволяет модели предсказывать несколько слов вместо одного, анализируя одновременно разные части предложения. Такой метод повышает точность работы модели и ее производительность;
  • mixture of Experts. Эта архитектура использует несколько специализированных и заранее обученных нейросетей-"экспертов" для анализа различных входных данных. Это позволяет ускорить обучение и повысить эффективность ИИ. DeepSeek V3 работает с 256 такими нейросетями, из которых восемь активируются для обработки каждого токена;
  • технологию Multi-head Latent Attention - механизм внимания, который обычно используется в больших языковых моделях и помогает им идентифицировать наиболее важные части предложения. MLA позволяет извлекать ключевые детали из фрагмента текста несколько раз, а не только один. Это означает, что ИИ с меньшей вероятностью упустит важную информацию.

Благодаря этим особенностям модель потребовала всего 2,788 млн часов или два месяца работы графических процессоров Nvidia H800 для обучения. Затраты на него составили $5,5 млн. Для сравнения - OpenAI потратила на обучение GPT $78 млн.

Разработчики утверждают, что в тестах нейросеть превзошла GPT-4о от OpenAI, Llama 3 от Meta и Claude 3.5 Sonnet от Anthropic в задачах программирования и обработки текста.

Главная особенность новой модели - это полностью открытый код, который позволяет разработчикам не только использовать технологию для коммерческих целей, но и адаптировать ее для решения различных задач в сфере искусственного интеллекта.

Возможности DeepSeek V3

Модель предлагает контекстное окно в 128 тыс. токенов, как и GPT-4o, что позволяет ей анализировать до 300 страниц текста.

Она способна:

  • генерировать тексты разных объемов и в разных жанрах;
  • искать информацию в интернете;
  • расшифровывать диаграммы и объяснять картинки;
  • писать код, корректно форматировать его и решать сложные задачи по программированию на языках C++, Go, Java, JavaScript, Python и Rust. Модель успешно интегрируется с редакторами кода;
  • рассуждать подобно GPT-o1 и o1-mini в режиме DeepThink.

DeepSeek V3 предлагает мультиязычность высокого уровня, а ее глубокое понимание китайского и английского позволяет работать с текстами без потери качества переводенного текста и смысла. Модель также поддерживает русский язык.

Минус нейросети в том, что пока она не позволяет анализировать материалы по ссылкам, а поддерживает только загрузки или выдержки из текстов.

Как пользоваться DeepSeek V3

DeepSeek предлагает несколько вариантов доступа, в том числе через открытые модели на Hugging Face, бесплатную версию на собственном сайте с контекстным окном до 32 тыс. токенов, API для коммерческого использования, локальное развертывание и мобильные приложения для iOS и Android. При выходе DeepSeek-R1 пользователям было доступно 50 бесплатных запросов в день, сейчас ограничения на сайте не указаны.

Как воспользоваться бесплатной версией на сайте

Пользователи могут получить доступ к DeepSeek V3 через сайт.

Для этого нужно:

  • перейти на сайт DeepSeek, нажать Start Now;
  • пройти регистрацию;
  • откроется диалоговое окно с чат-ботом. В нем, помимо обычного ответа, можно выбрать опцию DeepThink для рассуждений или Search для поиска данных в Интернете. Также для анализа можно прикрепить до 50 файлов разного формата размером до 100 МБ каждый.

Как воспользоваться мобильным приложением

В декабре 2024 года DeepSeek выпустила бесплатное мобильное приложение для своего чат-бота. Оно доступно в российских магазинах App Store и Google Play. Также приложение можно скачать с сайта разработчиков, выбрав Get DeepSeek App и просканировав QR-код.

После установки и открытия приложения нужно нажать Agree, чтобы согласиться с условиями его использования, пройти регистрацию, после чего появится диалоговое окно с чат-ботом.
 
Нашли ошибку в тексте?

Выделите ошибку и одновременно нажмите Ctrl + Enter


Если Вы располагаете информацией по теме данного материала, отправляйте нам видео или новости на почту.

новости по теме

Читаемое

Новости RT

    Новости Китая

      Ваше мнение

      Эксперты отмечают, что ведущую роль в развитии казахстанского туризма в последние годы играет Алматы. Наибольшую ценность для туристов в Алматы имеет экологический туризм, в частности горный кластер. При этом катастрофическая экологическая обстановка - одна из главных проблем города. Что, на ваш взгляд, необходимо сделать для улучшения экологический ситуации в мегаполисе и развития туризма?