Nvidia подготвува решение за побрзи AI одговори и поефикасни модели
Американскиот производител на чипови Nvidia подготвува нов процесор наменет за побрзо и поефикасно извршување на задачи поврзани со вештачка интелигенција, објави „Волстрит журнал“, повикувајќи се на извори запознаени со плановите. Новиот систем ќе биде насочен кон т.н. „инференц“ пресметки, односно обработка која им овозможува на моделите да даваат одговори на кориснички барања во реално време.
Според информациите, платформата треба да биде претставена на годишната GTC конференција на компанијата во Сан Хозе следниот месец. Во неа ќе биде вклучен и чип дизајниран од стартапот Groq, што укажува на продлабочување на соработката меѓу двете компании.
Веста доаѓа во момент кога OpenAI, креаторот на ChatGPT, бара начини да ја подобри брзината на одговори за одредени комплексни задачи, како развој на софтвер и комуникација меѓу различни софтверски системи. Според претходни извештаи, OpenAI не е целосно задоволен од перформансите на постојниот хардвер на Nvidia за одредени типови пресметки и разгледува алтернативни решенија кои би покриле дел од неговите идни потреби за инференц капацитет.
Иако се споменува дека OpenAI водел разговори со компании како Groq и Cerebras за обезбедување побрзи чипови, Nvidia во меѓувреме постигнала лиценцен договор вреден околу 20 милијарди долари со Groq, што практично ги ограничило тие преговори. Дополнително, во септември Nvidia соопшти дека планира инвестиција до 100 милијарди долари во OpenAI како дел од поширок договор што ѝ овозможува удел во стартапот и истовремено обезбедува средства за купување напредни чипови.
Ниту Nvidia ниту OpenAI засега не дадоа официјален коментар за најновите информации. Сепак, развојот на нови решенија за инференц пресметки покажува дека трката за побрза и поефикасна вештачка интелигенција влегува во нова фаза, во која оптимизацијата на хардверот станува клучен фактор за конкурентност.