Изследване на Berkeley’s Gorilla Large Language Model: Новата ера на програмирането
Въведение
В света на програмирането и изкуствения интелект, един от най-новите играчи на площадката е Gorilla Large Language Model (LLM), създаден от изследователите в UC Berkeley. Този модел е обучен върху три масивни машинни учебни хъбове: Torch Hub, TensorFlow Hub и HuggingFace, което му позволява да предоставя подходящи API извиквания. В тази статия ще разгледаме какво прави Gorilla толкова уникален и как той може да помогне на програмистите да кодират по-ефективно.
Какво е Gorilla Large Language Model?
Gorilla е голям езиков модел (LLM), който е обучен да превежда английски език в API извиквания. Това означава, че ако въведете заявка на английски език, Gorilla ще върне API извикване (код), което е най-релевантно за вашата заявка. Например, ако попитате “Как да създам приложение, което намира популярни нишки в Reddit?”, Gorilla ще върне код, който може да бъде използван за създаване на такова приложение.
Защо Gorilla е по-добър от другите LLM?
Един от най-големите предизвикателства пред LLM е способността да генерират точни API извиквания без грешки в аргументите. Това е проблем, с който се сблъскват много програмисти, когато използват LLM като ChatGPT. Gorilla е обучен специално да решава този проблем, което го прави изключително надежден. Освен това, Gorilla е обучен да намалява грешките от халюцинации, което означава, че той е по-малко вероятно да генерира неверни или нерелевантни API извиквания.
Как работи Gorilla?
Gorilla използва техника, наречена “retriever-aware training”, където обучаващият набор от даннивключва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация. По време на извод, потребителите предоставят подсказки на естествен език. Gorilla може да работи в два режима: zero-shot и retrieval. В режим zero-shot, подсказката се подава директно на модела Gorilla LLM, който връща препоръчаното API извикване за изпълнение на задачата или целта. В режим на извличане, извличателят (или BM25, или GPT-Index) извлича най-актуалната API документация от API базата данни. Тази документация се конкатенира с потребителската подсказка, заедно със съобщение, указващо справката към API документацията. Конкатенираният вход се подава на Gorilla, който извежда API, което трябва да бъде извикано.
Как мога да използвам Gorilla?
Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT. Всъщност, този модел може да бъде добър кандидат за интеграция от мета-модел, така че API извикванията просто ще работят безпроблемно и дори няма да осъзнаете, че използвате Gorilla.
Как се справя Gorilla с предизвикателствата?
Gorilla се справя с предизвикателствата на API извикванията, които често идват с ограничения, като добавя сложност към разбирането и категоризирането на извикванията от страна на LLM. Например, подсказка може да изисква извикване на модел за класификация на изображения с конкретни ограничения за размер и точност на параметрите. Тези предизвикателства подчертават необходимостта от LLM да разбира не само функционалното описание на API извикване, но и да разсъждава за вградените ограничения.
Какво следва за Gorilla?
Със своята способност да превежда естествен език в API извиквания и да намалява грешките от халюцинации, Gorilla представлява един от най-интересните подходи в областта на инструментите, подкрепящи LLM. Надяваме се, че ще видим модела разпространен в някои от основните ML хъбове в областта.
Заключение
Gorilla е мощен инструмент, който може да улесни работата на програмистите, като предоставя точни API извиквания. Той е обучен върху масивни машинни учебни хъбове и е способен да намалява грешките от халюцинации, което го прави изключително надежден. Ако сте програмист или изследовател в областта на LLM, Gorilla е инструмент, който трябва да разгледате.
Често задавани въпроси
- Какво е Gorilla Large Language Model?Gorilla е голям езиков модел, създаден от изследователите в UC Berkeley. Той е обучен върху три масивни машинни учебни хъбове и е способен да предоставя подходящи API извиквания.
- Как работи Gorilla?Gorilla използва техника, наречена “retriever-aware training”, където обучаващият набор от данни включва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация.
- Какво прави Gorilla по-добър от другите LLM?Gorilla се отличава с няколко ключови характеристики, включително способността да генерира точни API извиквания и намаляване на грешките от халюцинации.
- Как мога да използвам Gorilla?Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT.
- Какво е бъдещето на Gorilla?Gorilla е в началото на своята развойна пътека, но вече показва голям потенциал. Изследователите, които са го създали, продължават да работят върху подобряване на модела и разширяване на неговите възможности.
- Как работи Gorilla?Gorilla използва техника, наречена “retriever-aware training”, където обучаващият набор от данни включва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация.
- Как се справя Gorilla с предизвикателствата?Gorilla се справя с предизвикателствата на API извикванията, които често идват с ограничения, като добавя сложност към разбирането и категоризирането на извикванията от страна на LLM.
- Какво следва за Gorilla?Със своята способност да превежда естествен език в API извиквания и да намалява грешките от халюцинации, Gorilla представлява един от най-интересните подходи в областта на инструментите, подкрепящи LLM. Надяваме се, че ще видим модела разпространен в някои от основните ML хъбове в областта.
- Как мога да използвам Gorilla?Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT.
- Какво е бъдещето на Gorilla?Gorilla е в началото на своята развойна пътека, но вече показва голям потенциал. Изследователите, които са го създали, продължават да работят върху подобряване на модела и разширяване на неговите възможности.
https://drive.google.com/file/d/1E0k5mG1mTiaz0kukyK1PdeohJipTFh6j/view
Тази статия е написана от Тони Ангелчовски и е публикувана ексклузивно във форума на DT Garage. Всички права са запазени. Забранено е всякакво копиране, разпространение или използване на тази статия без изричното писмено разрешение на автора.
Новата Граница на Изкуствения ИнтелектGemini, последното творение на Google DeepMind, представлява значителен напредък в развитието на изкуствения интелект. Разработен от основите…
AIAI НОВИНИ7 МИНУТИ ЧЕТЕНЕ Microsoft наскоро представи два специално проектирани чипа за подобряване на AI и облачните възможности. Azure Maia…