From c9583eee6b1e1bfb4ed1c70c69f0d2229033df0a Mon Sep 17 00:00:00 2001 From: Junyang Lin Date: Wed, 30 Aug 2023 17:41:41 +0800 Subject: [PATCH] Update FAQ_zh.md --- FAQ_zh.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/FAQ_zh.md b/FAQ_zh.md index 174ae69..a318064 100644 --- a/FAQ_zh.md +++ b/FAQ_zh.md @@ -32,7 +32,7 @@ flash attention是一个用于加速模型训练推理的可选项,且仅适 #### 我没有GPU,只用CPU运行CLI demo可以吗? -可以的,运行`python cli_demo.py --cpu_only`命令即可将模型读取到CPU并使用CPU进行推理。 +可以的,运行`python cli_demo.py --cpu-only`命令即可将模型读取到CPU并使用CPU进行推理。 #### Qwen支持流式推理吗?