To enable more open-source research on instruction following large language models, we use generate 52K instruction-followng demonstrations using OpenAI's text-davinci-003 model.

Feb 1, 2026

General

PromptBeginner5 minmarkdown

repos:

- repo: https://github.com/pre-commit/pre-commit-hooks

Feb 1, 2026

General

PromptBeginner5 minmarkdown

![# LLaMA Factory](assets/logo.png)

[![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)

Feb 1, 2026

General

PromptBeginner5 minmarkdown

![# LLaMA Factory](assets/logo.png)

[![GitHub Repo stars](https://img.shields.io/github/stars/hiyouga/LLaMA-Factory?style=social)](https://github.com/hiyouga/LLaMA-Factory/stargazers)

Feb 1, 2026

General

PromptBeginner5 minmarkdown

.vscode

.git

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Byte-compiled / optimized / DLL files

__pycache__/

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Auto detect text files and perform LF normalization

* text=auto

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Tokenization

Qwen-7B uses BPE tokenization on UTF-8 bytes using the `tiktoken` package.

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp日本語｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Tokenization

> 注：作为术语的“tokenization”在中文中尚无共识的概念对应，本文档采用英文表达以利说明。

Feb 1, 2026

General

PromptBeginner5 minmarkdown

トークン化

Qwen-7B は `tiktoken` パッケージを使用して、UTF-8 バイトを BPE トークン化します。

Feb 1, 2026

General

PromptBeginner5 minmarkdown

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Large language models have recently attracted an extremely large amount of

Feb 1, 2026

General

PromptBeginner5 minmarkdown

中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a> ｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a> ｜ &nbsp<a href="README_FR.md">Français</a> ｜ &nbspEspañol

Feb 1, 2026

General

PromptBeginner5 minmarkdown

<a href="README_CN.md">中文</a>&nbsp ｜ &nbsp<a href="README.md">English</a>&nbsp ｜ &nbsp<a href="README_JA.md">日本語</a>&nbsp ｜ &nbspFrançais ｜ &nbsp<a href="README_ES.md">Español</a>

Feb 1, 2026

General

PromptBeginner5 minmarkdown

FAQ

flash attention是一个用于加速模型训练推理的可选项，且仅适用于Turing、Ampere、Ada、Hopper架构的Nvidia GPU显卡（如H100、A100、RTX 3090、T4、RTX 2080），您可以在不安装flash attention的情况下正常使用模型进行推理。

Feb 1, 2026

Find agent skills by outcome

Contributor Covenant Code of Conduct

<!---

Byte-compiled / optimized / DLL files

repos:

<!---

Byte-compiled / optimized / DLL files

Alpaca Model Card

<p align="center" width="100%">

Alpaca Instruction Following Dataset

repos:

![# LLaMA Factory](assets/logo.png)

![# LLaMA Factory](assets/logo.png)

.vscode

Byte-compiled / optimized / DLL files

Auto detect text files and perform LF normalization

Tokenization

<p align="left">

Tokenization

トークン化

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

<p align="left">

<p align="left">

<p align="left">

FAQ