new-star
avatar image $

LongLLaMa

0 Yêu thích
(0 | 0 voted)
LongLLaMA là một mô hình ngôn ngữ lớn được thiết kế để xử lý ngữ cảnh văn bản phức tạp, có khả năng xử lý lên đến 256.000 từ. Nó dựa trên OpenLLaMA và được điều chỉnh lại bằng phương pháp Focused Transformer (FoT). Kho lưu trữ cung cấp một biến thể cơ bản nhỏ hơn 3B của LongLLaMA với giấy phép Apache 2.0 để sử dụng trong các hiện thực hiện có. Ngoài ra, nó cung cấp mã để điều chỉnh hướng dẫn và tiếp tục tiền huấn luyện FoT. Điểm đột phá chính của LongLLaMA là khả năng quản lý ngữ cảnh dài hơn đáng kể so với dữ liệu huấn luyện của nó, làm cho nó hữu ích cho các nhiệm vụ đòi hỏi hiểu biết ngữ cảnh rộng rãi. Nó bao gồm các công cụ để tích hợp dễ dàng vào Hugging Face cho các nhiệm vụ xử lý ngôn ngữ tự nhiên.

LongLLaMA là một mô hình ngôn ngữ lớn được thiết kế để xử lý ngữ cảnh văn bản phức tạp, có khả năng xử lý lên đến 256.000 từ. Nó dựa trên OpenLLaMA và được điều chỉnh lại bằng phương pháp Focused Transformer (FoT). Kho lưu trữ cung cấp một biến thể cơ bản nhỏ hơn 3B của LongLLaMA với giấy phép Apache 2.0 để sử dụng trong các hiện thực hiện có. Ngoài ra, nó cung cấp mã để điều chỉnh hướng dẫn và tiếp tục tiền huấn luyện FoT. Điểm đột phá chính của LongLLaMA là khả năng quản lý ngữ cảnh dài hơn đáng kể so với dữ liệu huấn luyện của nó, làm cho nó hữu ích cho các nhiệm vụ đòi hỏi hiểu biết ngữ cảnh rộng rãi. Nó bao gồm các công cụ để tích hợp dễ dàng vào Hugging Face cho các nhiệm vụ xử lý ngôn ngữ tự nhiên.

Mô hình giá cả:

price unknown / product not launched yet
Danh mục.: #research
Light
Neutral
Dark
LongLLaMa
LongLLaMa
LongLLaMa
Copy embed code

Khám phá các công cụ AI tương tự