NodeJSで番号を検出するためにtesseract.jsを使用しています。たとえば、これは私の画像です:
スクリプトを実行すると、次のようなものが検出されます。
289,0
また、画像のノイズのために、スペース、コンマなどの他の記号が考慮されます。
とにかく、数字だけを指定でき、スペースやコンマのような他の記号は指定できませんか?
また、これは私のコードです:
tesseract.recognize(
__dirname + '/Captcha.png',
'eng',
{ logger: m => console.log(m) }
).then(({ data: { text } }) => {
console.log(text);
});
私はjstesseract APIを持っていませんが、後でフィルターを使用することで、非常に簡単な回避策があるようです。
tesseract.recognize(
__dirname + '/Captcha.png',
'eng',
{ logger: m => console.log(m) }
).then(({ data: { text } }) => {
const filteredText = Array.from(text.matchAll(/\d/g)).join("")
console.log(filteredText)
})
フィルタリング機能のみのテストは次のとおりです。
if (Array.from("209, 1".matchAll(/\d/g)).join("") !== "2091") {
throw("Not working")
}
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加