Apple-ի հետազոտական բաժինը Սանտա Բարբարայի Կալիֆոռնիայի համալսարանի հետազոտողների հետ համատեղ թողարկել է MGIE-ը՝ արհեստական բանականության (ԱԲ) մուլտիմոդալ մոդելը, որը նախատեսված է լուսանկարները խմբագրելու համար: Լուսանկարում փոփոխություններ կատարելու համար օգտատերը պետք է միայն բնական լեզվով նկարագրի, թե որպես արդյունք ինչ է ցանկանում ստանալ:
MGIE-ը (Multimodal Large Language Model-Guided Image Editing) կարող է օգտագործվել լուսանկարի խմբագրման հետ կապված տարբեր բարդության առաջադրանքների համար. դրա միջոցով հնարավոր է ավելացնել տարբեր առարկաներ, հեռացնել կամ փոխել դրանք: Հրաման ստանալիս մոդելը մեկնաբանում է օգտատիրոջ խոսքերը, այնուհետև «պատկերացնում» է, թե ինչ տեսք կունենա նկարը դրանց համապատասխան այն փոփոխելու դեպքում։
MGIE-ն նկարագրող հոդվածում բերվում են նրա աշխատանքի մի քանի օրինակներ։ Երբ մոդելին խնդրում են խմբագրել պիցցայի լուսանկարը, որպեսզի «այն ավելի առողջ դառնա», ծրագիրը պիցցային ավելացրել է բանջարեղեն։ Այնուհետև նրան առաջարկել են անապատում գտնվող վագրակատվի չափազանց մութ լուսանկար և խնդրել են «ավելացնել կոնտրաստ՝ ավելի շատ լույսի նմանակելով», ծրագիրն ավելի է պայծառացրել պատկերը։
MGIE-ն հասանելի է անվճար ներբեռնման համար GitHub-ում, և հնարավոր է փորձել Hugging Face Spaces հարթակում: Apple-ը չի հստակեցրել, թե հետազոտական նախագծից դուրս ընկերությունն ինչ ծրագրեր ունի այս մոդելի հետ։
Պատկերի խմբագրման հնարավորություն ունեն ԱԲ մի քանի գեներատորներ, ներառյալ OpenAI DALL-E 3-ը։ Գեներատիվ ԱԲ-ի գործառույթներ կան նաև Photoshop-ում Adobe Firefly մոդելի շնորհիվ: Apple-ը չի դիրքավորվում որպես ԱԲ-ի ոլորտի խոշոր խաղացող, ինչպիսին են Microsoft-ը, Meta-ն կամ Google-ը, սակայն գլխավոր տնօրեն Թիմ Քուքը վերջերս ասել էր, որ ընկերությունն իր սարքերում այս տարի ԱԲ նոր հնարավորություններ կավելացնի: Անցյալ տարվա դեկտեմբերին ընկերությունը թողարկեց Apple Silicon չիպերով գործող MLX բաց հարթակը, որը նախատեսված է ԱԲ մոդելների ուսուցման համար: