C++模糊搜索实现_编辑距离Levenstein算法案例

时间：2026-04-09

Levenshtein距离用动态规划二维表实现，dpi表示s1前i字符到s2前j字符的最小编辑距离，初始化边界后按相等/不等转移，时间O(mn)，空间可优化至O(min(m,n))。

c++怎么实现字符串的模糊搜索_c++ 编辑距离算法Levenstein实现【案例】

Levenshtein 距离函数怎么写（C++ 基础实现）

直接用动态规划填二维表是最清晰、最易调试的写法。核心是定义 dp[i][j] 表示 s1.substr(0, i) 到 s2.substr(0, j) 的最小编辑距离，状态转移只依赖左、上、左上三个格子。

注意边界初始化：空字符串到长度为 j 的字符串需要 j 次插入；同理，长度为 i 到空字符串需 i 次删除。

int levenshtein(const std::string& s1, const std::string& s2) {
    int m = s1.size(), n = s2.size();
    std::vector> dp(m + 1, std::vector(n + 1));
for (int i = 0; i <= m; ++i) dp[i][0] = i;
for (int j = 0; j <= n; ++j) dp[0][j] = j;

for (int i = 1; i <= m; ++i) {
    for (int j = 1; j <= n; ++j) {
        if (s1[i-1] == s2[j-1]) {
            dp[i][j] = dp[i-1][j-1];
        } else {
            dp[i][j] = 1 + std::min({
                dp[i-1][j],    // 删除
                dp[i][j-1],    // 插入
                dp[i-1][j-1]   // 替换
            });
        }
    }
}
return dp[m][n];
}

如何用 Levenshtein 实现模糊搜索（带阈值匹配）

编辑距离本身不是“搜索”，而是衡量相似度的工具。模糊搜索的关键在于：对候选字符串批量调用 levenshtein()，再按距离排序或过滤。

阈值建议设为 std::min(s1.size(), s2.size()) / 3 或固定小整数（如 1~3），避免长串误匹配
若候选集很大（>1000 条），别暴力遍历——先用长度差预筛：abs((int)s1.size() - (int)s2.size()) > threshold 直接跳过
区分大小写？确保输入前统一调用 std::tolower 转换，否则 "Apple" 和 "apple" 距离为 1（首字母替换），而非 0