Предварителен преглед на Tencent с отворен код Hunyuan Hy3, фокусиран върху практическото внедряване
23 април — Tencent пусна и отвори своя голям езиков модел Hunyuan Hy3 визуализация. Моделът използва архитектура от смесени експерти (MoE) с общо 295 милиарда параметри, 21 милиарда активни параметри и поддържа до 256K дължина на контекста. Tencent каза, че моделът подобрява следването на инструкциите, разбирането на дълъг контекст, сложните разсъждения и способностите на агентите.…










