Explore

Find agent skills by outcome

138,836 skills indexed with the new KISS metadata standard.

Showing 24 of 138,836Categories: Creative, General, Data, Coding & Debugging

PromptBeginner5 minmarkdownQuality: 68

!# LLaMA Factory

PromptBeginner5 minmarkdownQuality: 45

repos:

- repo: https://github.com/pre-commit/pre-commit-hooks

PromptBeginner5 minmarkdownQuality: 41

Auto detect text files and perform LF normalization

* text=auto

PromptBeginner5 minmarkdownQuality: 45

Byte-compiled / optimized / DLL files

pycache/

PromptBeginner5 minmarkdownQuality: 37

.vscode

.git

PromptBeginner5 minmarkdownQuality: 62

トークン化

Qwen-7B は tiktoken パッケージを使用して、UTF-8 バイトを BPE トークン化します。

PromptBeginner5 minmarkdownQuality: 68

Tokenization

注：作为术语的“tokenization”在中文中尚无共识的概念对应，本文档采用英文表达以利说明。

PromptBeginner5 minmarkdownQuality: 68

Untitled Skill

中文&nbsp ｜ &nbspEnglish&nbsp ｜ &nbsp日本語｜ &nbspFrançais ｜ &nbspEspañol

PromptBeginner5 minmarkdownQuality: 68

Tokenization

Qwen-7B uses BPE tokenization on UTF-8 bytes using the tiktoken package.

PromptBeginner5 minmarkdownQuality: 63

Introducing Qwen-7B: Open foundation and human-aligned models (of the state-of-the-arts)

Large language models have recently attracted an extremely large amount of

PromptBeginner5 minmarkdownQuality: 68

Untitled Skill

中文&nbsp ｜ &nbspEnglish&nbsp ｜ &nbsp日本語｜ &nbspFrançais ｜ &nbspEspañol

PromptBeginner5 minmarkdownQuality: 68

Untitled Skill

中文&nbsp ｜ &nbspEnglish&nbsp ｜ &nbsp日本語｜ &nbspFrançais ｜ &nbspEspañol

PromptBeginner5 minmarkdownQuality: 68

Untitled Skill

中文&nbsp ｜ &nbspEnglish&nbsp ｜ &nbsp日本語&nbsp ｜ &nbspFrançais ｜ &nbspEspañol

PromptBeginner5 minmarkdownQuality: 50

FAQ

Flash attention は、トレーニングと推論を加速するオプションです。H100、A100、RTX 3090、T4、RTX 2080 などの Turing、Ampere、Ada、および Hopper アーキテクチャの NVIDIA GPU だけが、flash attention をサポートできます。それをインストールせずに私たちのモデルを使用することができます。

PromptBeginner5 minmarkdownQuality: 68

Untitled Skill

中文&nbsp ｜ &nbspEnglish&nbsp ｜ &nbsp日本語｜ &nbspFrançais ｜ &nbspEspañol

PromptBeginner5 minmarkdownQuality: 50

FAQ

flash attention是一个用于加速模型训练推理的可选项，且仅适用于Turing、Ampere、Ada、Hopper架构的Nvidia GPU显卡（如H100、A100、RTX 3090、T4、RTX 2080），您可以在不安装flash attention的情况下正常使用模型进行推理。

PromptBeginner5 minmarkdownQuality: 50

FAQ

Flash attention is an option for accelerating training and inference. Only NVIDIA GPUs of Turing, Ampere, Ada, and Hopper architecture, e.g., H100, A100, RTX 3090, T4, RTX 2080, can support flash atte...

PromptBeginner5 minmarkdownQuality: 33

pycache

*.so

PromptBeginner5 minmarkdownQuality: 37

pycache

*.so

PromptBeginner5 minmarkdownQuality: 46

Project Specification #####

/test

PromptBeginner5 minmarkdownQuality: 65

Untitled Skill

PromptBeginner5 minmarkdownQuality: 65

Untitled Skill

PromptBeginner5 minmarkdownQuality: 37

*.tmp

*.swp

PromptBeginner5 minmarkdownQuality: 62

BELLE: Be Everyone's Large Language model Engine

中文README.