你的 LLM 不会写出正确代码,它只会写出“看起来合理”的代码

这篇文章用两个由 LLM 驱动的 Rust 项目做案例,论证“生成看起来像对的代码”与“交付真正正确、可验证、能经受约束的系统”之间仍然存在巨大的工程鸿沟。核心论点文章最强的论点是:LLM 更擅长生成“结构上像那么回事”的实现,而不是自动补齐那些决定正确性和性能的关键细节。在数据库案例里,这个差距不是抽象感觉,而是量化…

正在初始化 WebAssembly 引擎…
首次编译原生模块可能需要数秒
就绪后,页面交互将以接近原生的速度运行