To enable more open-source research on instruction following large language models, we use generate 52K instruction-followng demonstrations using OpenAI's text-davinci-003 model.

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Alpaca Model Card

**Organization developing the model**

Feb 1, 2026

General

PromptBeginner5 minmarkdown

![# LLaMA Factory](assets/logo.png)

[![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)

Feb 1, 2026

General

PromptBeginner5 minmarkdown

repos:

- repo: https://github.com/pre-commit/pre-commit-hooks

Feb 1, 2026

General

PromptBeginner5 minmarkdown

![# LLaMA Factory](assets/logo.png)

[![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Auto detect text files and perform LF normalization

* text=auto

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Byte-compiled / optimized / DLL files

__pycache__/

Feb 1, 2026

General

PromptBeginner5 minmarkdown

.vscode

.git

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Tokenization

Qwen-7B uses BPE tokenization on UTF-8 bytes using the `tiktoken` package.

Feb 1, 2026

General

PromptBeginner5 minmarkdown

トークン化

Qwen-7B は `tiktoken` パッケージを使用して、UTF-8 バイトを BPE トークン化します。

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Large language models have recently attracted an extremely large amount of

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp日本語｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Tokenization

> 注：作为术语的“tokenization”在中文中尚无共识的概念对应，本文档采用英文表达以利说明。

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a>&nbsp ｜ &nbspFrançais ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a> ｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbspEspañol

Feb 1, 2026

General

PromptBeginner5 minmarkdown

中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a> ｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

FAQ

Flash attention is an option for accelerating training and inference. Only NVIDIA GPUs of Turing, Ampere, Ada, and Hopper architecture, e.g., H100, A100, RTX 3090, T4, RTX 2080, can support flash attention. **You can use our models without installing it.**

Feb 1, 2026

Find agent skills by outcome

TRL - Transformer Reinforcement Learning

<!---

Byte-compiled / optimized / DLL files

repos:

<!---

Byte-compiled / optimized / DLL files

<p align="center" width="100%">

Alpaca Instruction Following Dataset

Alpaca Model Card

![# LLaMA Factory](assets/logo.png)

repos:

![# LLaMA Factory](assets/logo.png)

Auto detect text files and perform LF normalization

Byte-compiled / optimized / DLL files

.vscode

Tokenization

トークン化

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

<p align="left">

Tokenization

<p align="left">

<p align="left">

<p align="left">

FAQ