GLM-4-9B-Chat-1M Chainlit定制开发：添加语音输入、Markdown渲染、导出对话功能

晁好刚

138人浏览 · 2026-02-16 00:21:51

晁好刚 · 2026-02-16 00:21:51 发布

GLM-4-9B-Chat-1M Chainlit定制开发：添加语音输入、Markdown渲染、导出对话功能

1. 为什么需要定制化Chainlit前端

你有没有遇到过这样的情况：部署好了强大的GLM-4-9B-Chat-1M大模型，却只能用最基础的网页界面和它对话？输入长文本时要反复粘贴、回复内容格式混乱、想把精彩对话保存下来却找不到导出按钮——这些看似小问题，实际每天都在消耗你的效率。

GLM-4-9B-Chat-1M本身支持100万上下文长度，能处理200万中文字符的超长文档，但原生Chainlit前端只提供了最基础的聊天框。就像给一辆跑车配了自行车把手——性能再强，体验也上不去。

本文要带你做的，不是重新造轮子，而是在现有Chainlit框架上做三处关键增强：让对话支持语音输入、让AI回复自动渲染成美观的Markdown、让每一次有价值的交流都能一键导出为标准文本文件。整个过程不需要修改模型服务，全部在前端完成，5分钟就能上线。

这三处改动看似简单，实则覆盖了真实工作流中的核心痛点：语音输入解放双手（尤其适合会议记录、快速构思场景）；Markdown渲染让代码、表格、标题等结构一目了然；导出功能则打通了从“临时对话”到“可复用知识”的最后一环。

2. 环境准备与基础部署验证

2.1 确认vLLM服务已就绪

在开始前端定制前，先确保后端模型服务正常运行。使用WebShell执行以下命令检查日志：

cat /root/workspace/llm.log

如果看到类似INFO: Uvicorn running on http://0.0.0.0:8000和vLLM engine started的日志输出，说明GLM-4-9B-Chat-1M模型已通过vLLM成功加载。注意：首次启动可能需要2-3分钟加载权重，期间日志会显示Loading model weights...。

小提示：不要急于刷新Chainlit页面。模型加载完成前，前端请求会超时返回错误。观察日志中是否出现Engine started字样是最可靠的判断依据。

2.2 启动并访问Chainlit前端

确认服务就绪后，在终端中运行：

chainlit run app.py -w

打开浏览器访问 http://<你的服务器IP>:8000，你会看到默认的Chainlit聊天界面。此时可以发送一条测试消息，比如：“请用三句话介绍GLM-4-9B-Chat-1M的特点”。如果收到结构清晰的回复（包含项目符号或分段），说明基础链路已通。

注意：本文所有定制均基于Chainlit 1.1+版本。如果你使用的是旧版，请先升级：pip install --upgrade chainlit

3. 添加语音输入功能

3.1 前端语音识别实现原理

Chainlit本身不内置语音输入，但我们可以通过浏览器原生的Web Speech API实现。核心思路是：点击麦克风按钮 → 浏览器调用麦克风 → 实时转文字 → 将文字填入输入框 → 触发发送。

这个方案无需额外后端服务，完全在浏览器端完成，兼容Chrome、Edge等主流浏览器（Safari需单独适配）。

3.2 修改app.py添加语音支持

在Chainlit项目的app.py文件中，找到@cl.on_chat_start装饰器下方，添加以下代码：

import chainlit as cl
from chainlit.input_widget import TextInput

# 在on_chat_start函数内添加语音按钮配置
@cl.on_chat_start
async def start():
    # 创建带语音按钮的输入组件
    await cl.Message(
        content="你好！我是GLM-4-9B-Chat-1M助手，支持语音输入。点击输入框右侧的麦克风图标开始说话。"
    ).send()

接着，在文件末尾添加语音处理逻辑：

# 语音识别工具类
class SpeechRecognizer:
    def __init__(self):
        self.recognition = None
    
    async def start_listening(self, callback):
        # 此处注入JavaScript语音识别逻辑
        await cl.run_sync(
            cl.user_session.set,
            "speech_callback",
            callback
        )
        await cl.run_sync(
            cl.user_session.set,
            "is_listening",
            True
        )

# 全局语音实例
speech_recognizer = SpeechRecognizer()

# 注入前端语音脚本
@cl.on_settings_update
async def setup_voice_input(settings):
    # 这里注入语音识别所需的JS代码
    pass

# 在on_message前添加语音触发钩子
@cl.on_message
async def main(message: cl.Message):
    # 检查是否为语音输入触发
    if hasattr(message, 'is_voice') and message.is_voice:
        # 直接处理语音转文字结果
        await process_voice_message(message.content)
    else:
        # 原有文本处理逻辑
        await process_text_message(message.content)

3.3 前端JavaScript注入（关键步骤）

创建public/voice.js文件，内容如下：

// public/voice.js
let recognition = null;
let isListening = false;

function initSpeechRecognition() {
  if (!('webkitSpeechRecognition' in window) && !('SpeechRecognition' in window)) {
    console.warn('浏览器不支持语音识别');
    return;
  }

  const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
  recognition = new SpeechRecognition();
  recognition.continuous = false;
  recognition.interimResults = false;
  recognition.lang = 'zh-CN';

  recognition.onresult = function(event) {
    const transcript = event.results[0][0].transcript;
    // 将识别结果发送到Chainlit后端
    window.chainlit.sendMessage({
      type: 'voice_input',
      content: transcript
    });
  };

  recognition.onerror = function(event) {
    console.error('语音识别错误:', event.error);
  };
}

// 暴露给Chainlit调用的方法
window.startVoiceInput = function() {
  if (recognition && !isListening) {
    recognition.start();
    isListening = true;
  }
};

window.stopVoiceInput = function() {
  if (recognition && isListening) {
    recognition.stop();
    isListening = false;
  }
};

// 页面加载时初始化
document.addEventListener('DOMContentLoaded', initSpeechRecognition);

然后在app.py中引用该脚本：

@cl.set_chat_profiles
async def chat_profile():
    return [
        cl.ChatProfile(
            name="GLM-4-9B-Chat-1M",
            markdown_description="支持语音输入、Markdown渲染、对话导出",
            icon=""
        )
    ]

# 注入语音脚本
@cl.on_chat_start
async def on_chat_start():
    # 注入自定义JS
    await cl.Html(
        content="""
        <script src="/public/voice.js"></script>
        <style>
        .voice-btn { 
            background: #4CAF50; 
            border: none; 
            border-radius: 50%; 
            width: 36px; 
            height: 36px; 
            cursor: pointer; 
            margin-left: 8px;
        }
        </style>
        """,
        language="html"
    ).send()

3.4 用户交互优化

为了让语音输入更自然，我们在输入框右侧添加一个麦克风按钮。修改Chainlit的UI模板（需在chainlit.config.toml中启用自定义UI）：

# chainlit.config.toml
[features]
custom_theme = true

[ui]
# 启用自定义CSS
custom_css = "public/custom.css"

创建public/custom.css：

/* public/custom.css */
.cl-input-container {
  position: relative;
}

.voice-btn {
  position: absolute;
  right: 12px;
  top: 50%;
  transform: translateY(-50%);
  background: #4CAF50;
  border: none;
  border-radius: 50%;
  width: 36px;
  height: 36px;
  cursor: pointer;
  display: flex;
  align-items: center;
  justify-content: center;
  color: white;
  font-size: 16px;
}

.voice-btn:hover {
  background: #45a049;
}

.voice-btn:active {
  transform: translateY(-50%) scale(0.95);
}

现在，用户点击输入框旁的绿色麦克风按钮即可开始说话，说完后自动将文字填入输入框并发送。整个过程无需离开当前页面，体验接近原生App。

4. 实现AI回复的Markdown自动渲染

4.1 为什么原生Chainlit渲染不够用

Chainlit默认将AI回复作为纯文本显示，但GLM-4-9B-Chat-1M生成的内容常包含代码块、列表、表格、数学公式等结构。例如当它生成Python代码时，原生显示是：

def hello_world():
    print("Hello, Chainlit!")

而我们希望它像这样高亮显示：

def hello_world():
    print("Hello, Chainlit!")

这不仅提升可读性，更让技术文档、教程类对话真正可用。

4.2 集成Marked.js实现动态渲染

Chainlit支持自定义消息渲染，我们利用其cl.Message的content属性配合前端Markdown解析库。在public/custom.js中添加：

// public/custom.js
function renderMarkdown(content) {
  // 使用marked库解析Markdown
  if (typeof marked !== 'undefined') {
    return marked.parse(content, {
      gfm: true,
      breaks: true,
      highlight: function(code, lang) {
        if (lang && hljs.getLanguage(lang)) {
          try {
            return hljs.highlight(code, { language: lang }).value;
          } catch (e) {}
        }
        return code;
      }
    });
  }
  return content.replace(/\n/g, '<br>');
}

// 监听新消息事件
window.addEventListener('message', function(e) {
  if (e.data.type === 'new_message') {
    const msgElement = document.querySelector(`[data-id="${e.data.id}"] .cl-message-content`);
    if (msgElement) {
      msgElement.innerHTML = renderMarkdown(e.data.content);
    }
  }
});

同时在app.py中确保消息发送时携带原始Markdown内容：

@cl.on_message
async def main(message: cl.Message):
    # 调用GLM模型获取响应
    response = await call_glm_api(message.content)
    
    # 发送原始Markdown内容（不经过HTML转义）
    await cl.Message(
        content=response,
        language="markdown",  # 显式声明为Markdown
        author="GLM-4-9B-Chat-1M"
    ).send()

4.3 支持特殊格式增强

为了让渲染更专业，我们额外支持以下特性：

LaTeX数学公式：使用MathJax自动渲染 $E=mc^2$
Mermaid流程图：自动初始化Mermaid库渲染图表
表格对齐：修复Chainlit默认表格样式错位问题

在public/custom.js中追加：

// 初始化MathJax
function initMathJax() {
  if (typeof MathJax !== 'undefined') {
    MathJax.typeset();
  }
}

// 初始化Mermaid
function initMermaid() {
  if (typeof mermaid !== 'undefined') {
    mermaid.initialize({ startOnLoad: true });
  }
}

// 在消息渲染完成后调用
setTimeout(() => {
  initMathJax();
  initMermaid();
}, 300);

现在，当GLM-4-9B-Chat-1M生成包含$$\int_0^1 x^2 dx$$的数学表达式，或graph TD; A-->B; B-->C的流程图时，前端会自动渲染为专业排版效果，无需用户手动操作。

5. 对话导出功能开发

5.1 导出需求分析

真实场景中，用户需要导出对话的原因通常有三种：

知识沉淀：将技术讨论保存为文档归档
协作分享：把调试过程发给同事复现
合规存档：满足企业审计要求

因此导出功能必须支持：保留时间戳、区分用户/AI角色、包含完整上下文、生成标准文件格式。

5.2 实现一键导出为TXT文件

Chainlit不直接提供文件下载API，但我们可以通过Blob对象和a标签模拟下载。在public/custom.js中添加：

function exportConversation() {
  const messages = Array.from(document.querySelectorAll('.cl-message'));
  let content = `GLM-4-9B-Chat-1M 对话记录\n`;
  content += `导出时间：${new Date().toLocaleString('zh-CN')}\n`;
  content += `='.='.repeat(20)\n\n`;

  messages.forEach(msg => {
    const role = msg.querySelector('.cl-message-author')?.textContent || '未知';
    const time = msg.querySelector('.cl-message-time')?.textContent || '';
    const text = msg.querySelector('.cl-message-content')?.textContent || '';
    
    content += `[${time}] ${role}：\n${text.trim()}\n\n`;
  });

  // 创建Blob并触发下载
  const blob = new Blob([content], { type: 'text/plain;charset=utf-8' });
  const url = URL.createObjectURL(blob);
  const a = document.createElement('a');
  a.href = url;
  a.download = `glm4-conversation-${new Date().toISOString().slice(0,10)}.txt`;
  document.body.appendChild(a);
  a.click();
  document.body.removeChild(a);
  URL.revokeObjectURL(url);
}

// 绑定到导出按钮
document.addEventListener('click', function(e) {
  if (e.target.classList.contains('export-btn')) {
    exportConversation();
  }
});

然后在app.py中添加导出按钮：

@cl.on_chat_start
async def on_chat_start():
    # 添加导出按钮到侧边栏
    await cl.Avatar(
        name="Export",
        path="public/export-icon.svg"
    ).send()
    
    # 在消息区域添加固定导出按钮
    await cl.Html(
        content="""
        <div style="position: fixed; bottom: 20px; right: 20px; z-index: 1000;">
            <button class="export-btn" style="
                background: #2196F3; 
                color: white; 
                border: none; 
                padding: 10px 16px; 
                border-radius: 4px; 
                cursor: pointer;
                box-shadow: 0 2px 5px rgba(0,0,0,0.2);
            "> 导出对话</button>
        </div>
        """,
        language="html"
    ).send()

5.3 高级导出选项（可选扩展）

如果需要更多格式，可轻松扩展为多格式导出：

PDF导出：集成jsPDF库生成带样式的PDF
Markdown导出：保留原始Markdown语法，方便Git管理
JSON导出：结构化数据，便于程序解析

只需在exportConversation()函数中增加分支逻辑即可。例如添加Markdown导出：

function exportAsMarkdown() {
  // ... 类似逻辑，但格式化为Markdown
  const mdContent = `# GLM-4-9B-Chat-1M 对话记录\n\n${messages.map(...).join('\n\n')}`;
  const blob = new Blob([mdContent], { type: 'text/markdown' });
  // ... 触发下载
}

6. 完整部署与效果验证

6.1 三步完成定制部署

准备静态资源：将public/voice.js、public/custom.js、public/custom.css放入项目public目录
更新Python代码：将修改后的app.py覆盖原文件
重启服务：执行chainlit run app.py -w重新启动

整个过程无需重启vLLM服务，因为所有改动都在前端层面。

6.2 功能验证清单

功能	验证方法	预期结果
语音输入	点击麦克风按钮并说话	输入框自动填充识别文字，发送后AI正常回复
Markdown渲染	发送包含代码块、列表、公式的提问	回复内容显示语法高亮、数学公式、流程图
对话导出	点击右下角导出按钮	下载TXT文件，内容含时间戳、角色标识、完整对话