如何从数组中过滤掉非日语字符？

irregular 发表于 Dev

不规律的

function wordStat(text) {
    return text.split('').filter(function(letter){
        return letter > '\u3040' && letter < '\u4DBF';
    }).reduce(function (stat, word) {
        if (!stat[word]) stat[word] = 0;
        stat[word]++;
        return stat;
    }, {});
}

var input = document.querySelector('#input');
var output = document.querySelector('#output');

input.addEventListener('keyup', function () {
    output.value = JSON.stringify(wordStat(input.value), 2, 2);
})

但它似乎不起作用，这取决于我从何处复制日语文本。如果我从Rikai复制并粘贴字符，则可以正常工作，并且可以在结果数组中看到结果（预期结果），但是，如果从其他站点（例如Jisho词典）进行复制，则无法正常工作（字符被过滤掉）。

我将使用的方式是：我将有一个文本框，用户将在其中粘贴其日语文本，并且将过滤掉所有非日语字符的内容（取出[a-zA-Z所有其他语言的标点符号]。这带给我一个问题，即如何使用前端Javascript可靠地过滤掉非日语字符？

（根据Rikai日语字符为unicode \ u3040-\ u4DBF）

沙申克

看完代码和Rikai链接后，似乎您错过了很多字符：CJK unifed表意文字-常见和罕见的汉字（4e00-9faf）

我对您进行了很小的修改，filter看来可以成功地从Jisho字典中提取汉字字符：

function wordStat(text) {
    return text.split('').filter(function(letter){
        return (letter > '\u3040' && letter < '\u4DBF') || (letter > '\u4e00' && letter < '\u9faf');
    }).reduce(function (stat, word) {
        if (!stat[word]) stat[word] = 0;
        stat[word]++;
        return stat;
    }, {});
}

var input = document.querySelector('#input');
var output = document.querySelector('#output');

input.addEventListener('keyup', function () {
    output.value = JSON.stringify(wordStat(input.value), 2, 2);
});

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

我来说两句

0条评论

登录后参与评论

上一篇：在vim中将上一行添加到当前行的末尾

来自分类Dev

Related 相关文章

文章

如何从数组中过滤掉非日语字符？

如何从数组中过滤掉非日语字符？

如何从JS数组中过滤掉重复元素？

如何从项目列表中过滤掉

使用Python 3过滤掉文本中的所有非汉字字符

过滤掉 JavaScript 中的所有非字母数字字符

R：过滤掉数据框中的非数值

如何使用Swift FlatMap从数组中过滤掉可选项

如何从数组中过滤掉 HTML 标签并用空替换？

如何使用数组过滤掉 Woocommerce 中隐藏的产品

如何使用jQuery根据数组过滤掉结果

以最佳性能过滤掉CosmosDB查询中的数组项

过滤掉对象数组中的现有对象

用C++过滤掉数组中的重复值

过滤掉 Pandas DataFrame 中的“空数组”值

如何简化过滤掉无效字符的代码

从标准输入中过滤掉某些字符串

如何从计数不同的查询中过滤掉

如何使用grep或sed过滤掉html中的链接？

如何使用掩码字符或下面的字符串中的任何其他技巧过滤掉年份？

在 Python 3 中使用 Pandas，如何过滤掉数据框中列中的重复字符串？

角度过滤器，将重复ng的对象中的字符串数组与字符串数组进行比较，并过滤掉不匹配的对象

为什么我的PDF中存在不可见的字符，如何使用PDFBox过滤掉它们？

如何过滤掉休眠日志条目

Rust：如何过滤掉“无”排放？

如何过滤掉休眠日志条目

从valgrind输出中过滤掉垃圾

过滤掉Java中的价格或成本

过滤掉对象中的特定键

过滤掉PHP中的部分单词

删除重音符号并过滤掉非字母数字字符