Minigpt-4
MiniGPT-4 është një mjet që përmirëson kuptimin e lidhjes midis vizionit dhe gjuhës duke kombinuar një kodues vizual të ftohur me një model gjuhësor të madh të ftohur (LLM) duke përdorur vetëm një shtresë projeksioni. Ky mjet është në gjendje të gjenerojë përshkrimet e detajuara të imazheve, të krijojë faqe interneti nga skicat e shkruara me dorë, të shkruajë histori dhe poezi të frymëzuara nga imazhet e dhëna, të sigurojë zgjidhje për problemet e treguara në imazhe dhe të mësojë përdoruesit si të gatuajnë bazuar në foto të ushqimit. MiniGPT-4 është shumë efikas në aspektin kompjuterik, pasi që kërkon vetëm trajnimin e shtresës lineare për të përputhur tiparet vizuale me Vicuna duke përdorur rreth 5 milion çifte imazh-tekst të përputhur.
Modeli i çmimeve: