Alibaba і DeepSeek проти OpenAI: чому китайські відкриті моделі ШІ дозволяють бізнесу заощаджувати сотні тисяч доларів

Alibaba і DeepSeek проти OpenAI: чому китайські відкриті моделі ШІ дозволяють бізнесу заощаджувати сотні тисяч доларів

Коли розмови про штучний інтелект зводяться до ChatGPT від OpenAI, Copilot від Microsoft та Gemini від Google, може скластися враження, що саме ці продукти формують ринок. Та за лаштунками гучних брендів розгортається інша історія: дедалі більше компаній обирають не американські, а китайські моделі – насамперед через їхню ціну та відкритість.

Як мало відомі китайські моделі виходять у глобальні лідери

За даними індустрії, менш розкручені моделі штучного інтелекту з Китаю – зокрема DeepSeek та Qwen від Alibaba – наприкінці 2024 року продемонстрували стрибок використання бізнесом усього світу приблизно на 30%. Йдеться не лише про азійські компанії: до цих інструментів активно придивляються й у США та Європі.

Основна принада – вартість. Частина таких моделей або суттєво дешевша за інтеграцію з продуктами OpenAI, або взагалі майже безкоштовна для певних сценаріїв використання. Для великих компаній, які запускають десятки чи сотні внутрішніх сервісів на основі штучного інтелекту, це не дрібна економія, а серйозний фактор впливу на бюджет.

Деякі американські фірми змогли заощадити до 400 тисяч доларів на рік, відмовившись від дорогих закритих рішень на користь дешевших моделей з Китаю. Для бізнесу, що працює з мінімальною маржею або конкурує в насичених сегментах, така сума – аргумент, який важко ігнорувати.

Чому компанії з Кремнієвої долини роздивляються DeepSeek і Qwen

Попри те що преміальні моделі на кшталт ChatGPT зазвичай сприймаються як більш передові, самі технологічні компанії вже не завжди поспішають впроваджувати їх у свої продукти. Показовим став приклад Airbnb – сервісу короткострокової оренди житла, який перетворився з каліфорнійського стартапу на глобальну платформу, що змінила туристичну індустрію та ринок оренди в мегаполісах.

Генеральний директор Airbnb Браян Ческі в інтерв’ю Bloomberg визнав, що компанія спершу не захотіла інтегрувати модель OpenAI до свого чат-бота. За його словами, на момент ухвалення рішення технологія здавалася ще «не зовсім готовою» для того, щоб нею довірити роботу з користувачами в масштабах сервісу. Згодом Airbnb усе ж почала частково застосовувати розробки OpenAI, але не як основний рушій.

Ческі прямо розповів, що для повсякденної роботи компанія значною мірою покладається на Qwen – модель від китайського гіганта Alibaba. Вона, за його словами, показує хорошу якість відповідей, працює швидко і обходиться дешевше. Новітні моделі OpenAI Airbnb використовує радше обмежено, переважно не в наймасовіших сценаріях, саме через вищу вартість та вимоги до продуктивності.

Інвестори за останні роки вклали мільярди доларів у компанії на кшталт OpenAI та Anthropic, розраховуючи, що саме їхні продукти стануть основою для тисяч корпоративних сервісів. Однак парадокс у тому, що частина клієнтів цих же компаній дедалі частіше звертається до дешевших, відкритіших і нерідко іноземних альтернатив – передусім китайських.

Не лише ціна: чим приваблює відкритий код

Одна з головних переваг китайських моделей на кшталт DeepSeek та Qwen – їхній відкритий характер. На відміну від ChatGPT чи Gemini, які пропонуються як закриті, повністю контрольовані виробником сервіси, чимало китайських рішень постачаються у форматі open-source: компанії можуть завантажити модель, розгорнути її у власній інфраструктурі, змінювати налаштування, дообучати на своїх даних і загалом підлаштовувати під специфічні завдання.

Така свобода була затребувана давно. Ще кілька років тому, коли ChatGPT лише вибухнув у масову свідомість, великі фінансові й медійні гравці, зокрема Bloomberg, пробували будувати власні системи на базі відкритих моделей. Bloomberg, наприклад, створила BloombergGPT – мовну модель, спеціально натреновану на фінансових даних і новинах, із розрахунком краще розуміти біржові події та економічні звіти, ніж універсальні інструменти загального призначення.

Тоді, за визнанням учасників ринку, відкриті моделі суттєво поступалися ChatGPT за якістю відповідей, гнучкістю та стабільністю. Розрив здавався настільки великим, що власні розробки сприймалися як експеримент, а не як реальна заміна сервісам OpenAI. Проте до 2026 року ситуація змінилася. Нові відкриті моделі, зокрема створені китайськими компаніями, стрімко підтягнулися до лідерів, а в окремих завданнях – від генерації коду до аналізу документів – різниця стала мало відчутною для бізнес-користувачів.

Коли «достатньо добре» перемагає «найкраще»

Для багатьох компаній сьогодні вирішальним чинником стає не абстрактна «найвища якість», а співвідношення можливостей і витрат. Відкрита модель, яку можна розгорнути на власних серверах, не платити за кожен запит і тонко підлаштувати під внутрішні процеси, нерідко виявляється привабливішою за максимально потужне, але дороге та менш гнучке хмарне рішення.

Розробники, які працюють із такими системами, відзначають ще одну перевагу відкритих моделей: можливість використовувати ШІ нестандартним чином. Доступ до параметрів, архітектури та навчальних налаштувань відкриває простір для експериментів – від створення вузькоспеціалізованих помічників для юристів чи лікарів до внутрішніх інструментів для аналітики, де потрібні суворіші вимоги до збереження конфіденційної інформації.

Цим активно користуються й менші стартапи, для яких плата за використання API великих закритих моделей може стати непідйомним тягарем. Замість того, щоб вливати значну частину бюджету в оренду обчислювальних потужностей, вони беруть відкриті китайські моделі, дообучають їх на своїх даних і виводять на ринок продукти, які конкурують із сервісами, побудованими поверх ChatGPT або інших західних рішень.

Оцінка зсередини індустрії: що кажуть розробники

На цей зсув звертають увагу і засновники компаній, що будують власні сервіси поверх ШІ. Як повідомляє NBC News, Джеррі Лю, засновник DayFlow, приблизно оцінює, що близько 40% користувачів його платформи обирають відкриті китайські моделі замість закритих американських. DayFlow працює на перетині керування даними й автоматизації – це той тип сервісів, де витрати на запити до мовних моделей швидко ростуть разом із числом клієнтів.

Лю пояснює, що користувачі прагнуть не лише знизити рахунки за інфраструктуру, але й зберегти контроль над тим, як саме обробляються їхні дані. Відкриті моделі дозволяють будувати систему так, щоб чутлива інформація ніколи не залишала внутрішні сервери компанії, тоді як робота із зовнішніми хмарними сервісами передбачає довіру сторонньому постачальнику – навіть якщо формально договори й сертифікації гарантують конфіденційність.

У професійних спільнотах розробників також дедалі частіше лунають припущення, що стрімке зростання якості відкритих китайських моделей відбулося, зокрема, й завдяки уважному копіюванню рішень OpenAI та Anthropic. Йдеться не обов’язково про пряме порушення авторських прав, а про системне відтворення архітектур, підходів до навчання, параметрів тонкого налаштування й роботи з великими корпусами текстів. У технологічному світі це не новина: успішні ідеї швидко розповсюджуються, а конкуренти намагаються повторити те, що спрацювало в піонерів галузі.

Чому DeepSeek і Qwen так приваблюють, попри застереження

На ринку дедалі чіткіше відчувається, що DeepSeek і Qwen пропонують компаніям привабливий набір: нижча вартість, гнучкість відкритого коду і продуктивність, яка в більшості повсякденних завдань наближається до результатів закритих американських рішень. Це створює для них особливу репутацію – інструментів, які «достатньо хороші», щоби замінити дорогі преміум-моделі в багатьох робочих процесах.

Alibaba, розробник моделі Qwen, – це одна з найбільших технологічних корпорацій Китаю, яка починала як платформа електронної комерції, а згодом перетворилася на багатопрофільну групу з хмарними сервісами, фінансовими продуктами та власними дослідницькими центрами у сфері штучного інтелекту. Наявність потужної інфраструктури та доступ до величезних масивів даних дозволили їй швидко вийти на рівень, де її моделі вже сприймають як серйозних конкурентів західним гравцям.

DeepSeek, своєю чергою, позиціонується як інструмент, що особливо добре працює для програмістів і технічних фахівців. Компанії, які тестували його в реальних проєктах, відзначають прийнятну якість генерації коду й пояснень, при цьому загальна вартість експлуатації залишається значно нижчою, ніж у разі використання дорогих закритих API.

Однак за привабливою економією ховаються й ризики. Американські регулятори та силові структури уважно придивляються до того, як і де саме використовуються китайські моделі. Найпомітнішим сигналом стала заборона Військово-морських сил США на використання DeepSeek співробітниками – рішення пояснили занепокоєнням щодо конфіденційності та можливого витоку чутливих даних.

Безпека, геополітика й обережність державних структур

Позиція ВМС США показує, що питання вибору моделі штучного інтелекту сьогодні виходить далеко за межі технічних характеристик. Говорячи про військові відомства, важливо розуміти контекст: вони працюють з інформацією, що може стосуватися національної безпеки, операцій у відкритому морі, руху кораблів, логістики, комунікаційних протоколів та іншої критично важливої інфраструктури.

Будь-яка підозра, що фрагменти цих даних теоретично можуть опинитися під контролем іноземних структур або потрапити в навчальні масиви сторонніх систем, сприймається як загроза. Навіть якщо постачальник моделі декларує дотримання всіх стандартів безпеки, ризик для військових і розвідувальних організацій здається надто високим. Саме тому заборона DeepSeek у підрозділах ВМС стала відображенням ширшого тренду: державні структури США намагаються мінімізувати залежність від технологій, що походять з країн-конкурентів, насамперед Китаю.

Разом із тим у комерційному секторі тон розмови інший. Для більшості приватних компаній головне питання – наскільки реальною є загроза витоку саме їхніх даних і чи компенсує можливий ризик економія та додаткова гнучкість. У сферах, де працюють із менш конфіденційною інформацією або можуть обмежити обсяг даних, що потрапляють до моделі, китайські рішення продовжують активно тестувати й впроваджувати.

Ця напруга між міркуваннями безпеки та прагматикою витрат уже зараз формує своєрідну «лінію розмежування» на ринку штучного інтелекту. Державні структури та оборонні підрядники тяжіють до моделей, над якими мають максимальний контроль (зазвичай західного походження), тоді як частина комерційних гравців охочіше експериментує з відкритими інструментами з Китаю, якщо ті дають фінансову перевагу й достатній рівень функціональності.

Як змінюється ландшафт штучного інтелекту

Паралельно з боротьбою гучних брендів формується більш складна картина, де переможцем стає не завжди той, хто має найвищу точність відповідей чи наймасштабніші інвестиції. Своє місце виборюють карти з іншими перевагами: відкритим кодом, гнучкістю розгортання, меншими витратами та готовністю розробників швидко наслідувати успіхи конкурентів.

Приклади на кшталт Airbnb, що свідомо поєднує західні та китайські моделі, показують: навіть найбільші технологічні гравці мислять прагматично, а не ідеологічно. Вони готові будувати гібридні системи, де в одних сценаріях використовуються преміальні закриті моделі, а в інших – відкриті й дешевші. Для таких компаній ШІ – не священний символ «національної інновації», а інструмент, який повинен допомагати бронювати житло, відповідати користувачам, сортувати скарги та підказувати варіанти маршруту подорожі.

У цьому світі DeepSeek, Qwen та інші китайські моделі перестають бути екзотикою й дедалі частіше стають буденною частиною технологічного набору. Вони вже не виглядають тимчасовим компромісом, а сприймаються як самостійні інструменти, здатні змагатися за увагу розробників та бюджет компаній поряд із продуктами OpenAI, Anthropic, Google чи Microsoft.

Прокоментувати

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *