Perplexity и Intel Представляют Гибридный ИИ для ПК
На выставке Computex 2026 в Тайбэе Aravind Srinivas, генеральный директор Perplexity, и Lip-Bu Tan, генеральный директор Intel, объявили о запуске инновационного решения. Они представили первый в своем роде гибридный оркестратор вывода локального сервера, который появится в Perplexity Computer уже в июле. Эта система призвана революционизировать взаимодействие с ИИ, автоматически определяя, какие части задачи ИИ должны выполняться на вашем устройстве, а какие — маршрутизироваться к более мощным облачным моделям, без необходимости ручного выбора.
«Сегодня мы объявляем о следующем шаге для персонального компьютера: первом гибридном оркестраторе вывода локального сервера. Он автоматически решает, какая работа должна выполняться на вашем устройстве, а какая — отправляться облачным агентам, маршрутизируя каждую часть задачи в нужное место», — заявили в Perplexity.
Как Работает Гибридная Агентная Инференция
Решение Perplexity, названное «гибридной агентной инференцией», одновременно решает три ключевые проблемы: точность, конфиденциальность и стоимость. Компактная модель, работающая локально на вашем устройстве, действует как регулировщик трафика, определяя, какая информация достаточно конфиденциальна, чтобы оставаться локальной, а какие задачи требуют полной мощности облачной модели.
- Конфиденциальность данных: Чувствительная информация, такая как финансовые записи или медицинские данные, обрабатывается локально, не покидая ваше устройство.
- Эффективность: Легкие задачи, такие как суммирование или форматирование текста, выполняются на устройстве, снижая нагрузку на облачные ресурсы.
- Мощность: Сложные задачи, требующие обширных вычислений, направляются к мощным облачным моделям, обеспечивая высокую точность.
Финансовые Стимулы и Рост
Генеральный директор Perplexity Aravind Srinivas подчеркнул финансовую выгоду этой стратегии. Передача части работы по инференции на пользовательское оборудование значительно снижает операционные расходы компании.
«Вы не хотите, чтобы все ваши вычисления были централизованы на серверах и все выполнялось через крупнейшие модели. Некоторые люди тратят полмиллиарда долларов в месяц. На самом деле вам нужна эффективная ценность на ватт на пользователя», — объяснил Сринивас.
В апреле Perplexity объявила о значительном росте выручки с $100 миллионов до $500 миллионов, при этом численность персонала увеличилась всего на 34%. Это демонстрирует сильный стимул для компании, которая маршрутизирует запросы через модели, которые она не обучает, поддерживать вычислительные затраты на максимально низком уровне.
Конкурентная Среда и Дифференциация
Многие крупные игроки в сфере ИИ движутся к локальной или гибридной инференции. Apple Intelligence обрабатывает наиболее конфиденциальные данные локально на чипах серии M. Microsoft Foundry Local, достигший общей доступности в апреле 2026 года, позволяет выполнять полную инференцию ИИ на Windows, macOS и Linux без облачной зависимости. Nvidia также анонсировала RTX Spark на той же выставке Computex, нацеленный на локальную инференцию LLM на ноутбуках и настольных компьютерах.
Отличительной особенностью Perplexity является уровень оркестрации. Вместо того чтобы просить пользователей заранее выбирать локальный или облачный режим, система принимает решение для каждой задачи в реальном времени. Сринивас отметил, что подход «не зависит от чипа», хотя демонстрация на Computex проходила на Intel Core Ultra Series 3, поддерживаются также процессоры Nvidia. Эта функция пока эксклюзивна для приложения Perplexity для ПК с Windows, сроки более широкого распространения пока не подтверждены.
Часто Задаваемые Вопросы (FAQ)
Что такое гибридный оркестратор вывода Perplexity?
Это система, которая автоматически определяет, какие части задачи ИИ должны выполняться локально на вашем устройстве, а какие — в облаке, оптимизируя конфиденциальность данных, производительность и стоимость.
Какие преимущества предлагает гибридный подход Perplexity?
Он обеспечивает повышенную конфиденциальность, сохраняя чувствительные данные локально, снижает вычислительные затраты для компании и использует мощь облачных моделей для сложных задач, обеспечивая при этом высокую точность.
Будет ли система Perplexity полностью автономной или с открытым исходным кодом?
Нет, локальный компонент является компактной моделью, развернутой как часть приложения Perplexity, а облачный компонент по-прежнему маршрутизируется через серверы Perplexity. Это не полностью автономная или самохостинговая установка.
