FAQ
flash attention是一个用于加速模型训练推理的可选项,且仅适用于Turing、Ampere、Ada、Hopper架构的Nvidia GPU显卡(如H100、A100、RTX 3090、T4、RTX 2080),您可以在不安装flash attention的情况下正常使用模型进行推理。
Explore
125,247 skills indexed with the new KISS metadata standard.
flash attention是一个用于加速模型训练推理的可选项,且仅适用于Turing、Ampere、Ada、Hopper架构的Nvidia GPU显卡(如H100、A100、RTX 3090、T4、RTX 2080),您可以在不安装flash attention的情况下正常使用模型进行推理。
*.so
*.so
/test
*.swp
Read this in English.
中文README.
In order to make the contribution process as smooth as possible, we have established some
generic skill
pycache/
We are happy to accept your contributions to make this repo better and more awesome! To avoid unnecessary work on either
English | 中文
English | 中文
🇨🇳中文 | 🌐English | 📖文档/Docs | ❓提问/Issues | 💬讨论/Discussions | [⚔️
🇨🇳中文 | 🌐English | 📖文档/Docs | ❓提问/Issues | 💬讨论/Discussions | [⚔️
*/.DS_Store
generic skill
为了保证文件的完整性,请一定要检查下列文件SHA256值的一致性。
🇨🇳中文 | 🌐English | 📖文档/Docs | ❓提问/Issues | 💬讨论/Discussions | [⚔️竞技场/Ar
🇨🇳中文 | 🌐English | 📖文档/Docs | ❓提问/Issues | 💬讨论/Discussions | [⚔️竞技场/Ar