如何从数组中过滤掉非日语字符?

不规律的

我目前有这个http://jsfiddle.net/cuLa9mtf/8/

function wordStat(text) {
    return text.split('').filter(function(letter){
        return letter > '\u3040' && letter < '\u4DBF';
    }).reduce(function (stat, word) {
        if (!stat[word]) stat[word] = 0;
        stat[word]++;
        return stat;
    }, {});
}

var input = document.querySelector('#input');
var output = document.querySelector('#output');

input.addEventListener('keyup', function () {
    output.value = JSON.stringify(wordStat(input.value), 2, 2);
})

但它似乎不起作用,这取决于我从何处复制日语文本。如果我从Rikai复制并粘贴字符,可以正常工作,并且可以在结果数组中看到结果(预期结果),但是,如果从其他站点(例如Jisho词典)进行复制,则无法正常工作(字符被过滤掉)。

我将使用的方式是:我将有一个文本框,用户将在其中粘贴其日语文本,并且将过滤掉所有非日语字符的内容(取出[a-zA-Z所有其他语言的标点符号]。这带给我一个问题,即如何使用前端Javascript可靠地过滤掉非日语字符?

(根据Rikai日语字符为unicode \ u3040-\ u4DBF)

沙申克

看完代码和Rikai链接后,似乎您错过了很多字符:CJK unifed表意文字-常见和罕见的汉字(4e00-9faf)

我对您进行了很小的修改,filter看来可以成功地从Jisho字典中提取汉字字符:

function wordStat(text) {
    return text.split('').filter(function(letter){
        return (letter > '\u3040' && letter < '\u4DBF') || (letter > '\u4e00' && letter < '\u9faf');
    }).reduce(function (stat, word) {
        if (!stat[word]) stat[word] = 0;
        stat[word]++;
        return stat;
    }, {});
}

var input = document.querySelector('#input');
var output = document.querySelector('#output');

input.addEventListener('keyup', function () {
    output.value = JSON.stringify(wordStat(input.value), 2, 2);
});

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从JS数组中过滤掉重复元素?

来自分类Dev

如何从项目列表中过滤掉

来自分类Dev

使用Python 3过滤掉文本中的所有非汉字字符

来自分类Dev

过滤掉 JavaScript 中的所有非字母数字字符

来自分类Dev

R:过滤掉数据框中的非数值

来自分类Dev

如何使用Swift FlatMap从数组中过滤掉可选项

来自分类Dev

如何从数组中过滤掉 HTML 标签并用空替换?

来自分类Dev

如何使用数组过滤掉 Woocommerce 中隐藏的产品

来自分类Dev

如何使用jQuery根据数组过滤掉结果

来自分类Dev

以最佳性能过滤掉CosmosDB查询中的数组项

来自分类Dev

过滤掉对象数组中的现有对象

来自分类Dev

用C++过滤掉数组中的重复值

来自分类Dev

过滤掉 Pandas DataFrame 中的“空数组”值

来自分类Dev

如何简化过滤掉无效字符的代码

来自分类Dev

从标准输入中过滤掉某些字符串

来自分类Dev

如何从计数不同的查询中过滤掉

来自分类Dev

如何使用grep或sed过滤掉html中的链接?

来自分类Dev

如何使用掩码字符或下面的字符串中的任何其他技巧过滤掉年份?

来自分类Dev

在 Python 3 中使用 Pandas,如何过滤掉数据框中列中的重复字符串?

来自分类Dev

角度过滤器,将重复ng的对象中的字符串数组与字符串数组进行比较,并过滤掉不匹配的对象

来自分类Dev

为什么我的PDF中存在不可见的字符,如何使用PDFBox过滤掉它们?

来自分类Dev

如何过滤掉休眠日志条目

来自分类Dev

Rust:如何过滤掉“无”排放?

来自分类Dev

如何过滤掉休眠日志条目

来自分类Dev

从valgrind输出中过滤掉垃圾

来自分类Dev

过滤掉Java中的价格或成本

来自分类Dev

过滤掉对象中的特定键

来自分类Dev

过滤掉PHP中的部分单词

来自分类Dev

删除重音符号并过滤掉非字母数字字符

Related 相关文章

  1. 1

    如何从JS数组中过滤掉重复元素?

  2. 2

    如何从项目列表中过滤掉

  3. 3

    使用Python 3过滤掉文本中的所有非汉字字符

  4. 4

    过滤掉 JavaScript 中的所有非字母数字字符

  5. 5

    R:过滤掉数据框中的非数值

  6. 6

    如何使用Swift FlatMap从数组中过滤掉可选项

  7. 7

    如何从数组中过滤掉 HTML 标签并用空替换?

  8. 8

    如何使用数组过滤掉 Woocommerce 中隐藏的产品

  9. 9

    如何使用jQuery根据数组过滤掉结果

  10. 10

    以最佳性能过滤掉CosmosDB查询中的数组项

  11. 11

    过滤掉对象数组中的现有对象

  12. 12

    用C++过滤掉数组中的重复值

  13. 13

    过滤掉 Pandas DataFrame 中的“空数组”值

  14. 14

    如何简化过滤掉无效字符的代码

  15. 15

    从标准输入中过滤掉某些字符串

  16. 16

    如何从计数不同的查询中过滤掉

  17. 17

    如何使用grep或sed过滤掉html中的链接?

  18. 18

    如何使用掩码字符或下面的字符串中的任何其他技巧过滤掉年份?

  19. 19

    在 Python 3 中使用 Pandas,如何过滤掉数据框中列中的重复字符串?

  20. 20

    角度过滤器,将重复ng的对象中的字符串数组与字符串数组进行比较,并过滤掉不匹配的对象

  21. 21

    为什么我的PDF中存在不可见的字符,如何使用PDFBox过滤掉它们?

  22. 22

    如何过滤掉休眠日志条目

  23. 23

    Rust:如何过滤掉“无”排放?

  24. 24

    如何过滤掉休眠日志条目

  25. 25

    从valgrind输出中过滤掉垃圾

  26. 26

    过滤掉Java中的价格或成本

  27. 27

    过滤掉对象中的特定键

  28. 28

    过滤掉PHP中的部分单词

  29. 29

    删除重音符号并过滤掉非字母数字字符

热门标签

归档