오탉어 자동완성과 오타 교정 기능 | von Dongjun Lee | LBox-Team | Juli 2023

0
128


LBox-Funktion: ‚Geeignet‘

자동완성은 사색어 자동완성은 검색 스템의 기본적인 기능으로서, 1) 사용자가 직접 검색어를 입력하 2) 오타를 입력하지 않도록 도와주며 3) 사용자의 의도와 연관된 검색어를 발견할 수 있게 도와줍니다. 즉 사용자가 원하는 결과를 빠르고 쉽게 찾을 수 있도록 도와주는 도와주는 것이 가xnxx 큰 목적입니다.

이러한 검색어 자동완성 스템은 다음과 같이 구성이 됩니다.

출처: Ein Überblick über die automatische Vervollständigung von Abfragen beim Informationsabruf)

엘박스와 같은 판례 검색 스템의 우우 다음과 같은 추천을 해줄 수 있습니다.

  • 입력한 검색어를 기준으로 쿼리 로그를 통한 검색어 자동완성
  • 최근 검색어 보여주기
  • 최근 조회한 판례 및 관련 관련 판례 추천
  • 판사명 검색에 해당하는 경우 판사 이름 자동완성

이렇게 입력한 검색어(prefix)를 기반으로 이렇게 다양한 추천이 가능합니다. 이번 글에서는 특히 다뤄보고자 합니 Ja.

저희 엘박스의 발표된 Effiziente automatische Vervollständigung neuronaler Abfragen 을 참고하여 구현하였습니다. Die aktuelle Model von MCG (Most Context Era) ist eine neue Model von MCG (Most Context Era). 방식은 다음과 같습니다.

MCG 동작 방식 (출처 : https://arxiv.org/pdf/2008.02879.pdf)

„Günstigste Flüge von Seattle nach“. 를 생성해 줍니다. 생성할 수 있는 단어가 없을 때는 앞에서부터 하나씩 단어를 지워가면서 검색어 후보군을 생성하도록 합니다.

Ich habe eine Reihe von Flügen durchgeführt von Seattle nach‘ → ’sfo‘ 를 생성하다가 앞의 단어가 생략되면서(회색 글자) 이후에는 ’nach‘ → ‚Flughafen ‚, ’studieren‘.

Die Verwendung von Pseudo-Code ist nicht möglich.

MCG-Algorithmus (siehe: https://arxiv.org/pdf/2008.02879.pdf)
Beschreibung: https://en.wikipedia.org/wiki/Deterministic_asymmetric_finite_state_automaton

Die Funktion „QueryFST“ und „SuffixFST“ ist eine neue Funktion. QueryFST ist eine neue Datenbank, SuffixFST ist eine n-gram-basierte Datenbank. (FST und Finite-State-Transducer sind eine neue Model von FSM.)

Die MCG-Mitglieder haben sich für eine Reihe von Projekten entschieden, die für die Entwicklung von MCG verantwortlich sind 없는(Unseen) 새로운 검색어를 추천할 수 있습니다.

MCG-Leistung (Quelle: https://arxiv.org/pdf/2008.02879.pdf)
Rating-Leistung (Quelle: https://arxiv.org/pdf/2008.02879.pdf)

마지막으로 위 오른쪽 테이블에 따르면 MCG 알고리즘을 기반으로 검색어 후보군에 대한 Rating (Rating lernen) Die Zeit, in der Sie sich befinden, ist die Zeit, in der Sie sich befinden. 자세한 내용은 위 논문을 참고해 주third 바랍니다.

독특한 특징이 하나 있습니다. 바로 착어로서 하나의 문자를 초성, 중성, 종성으로 나눌 수 있다는 것입니다. 이 방식으로 인해서 조합형(초성, 중성, 종성을 각식으로 완성형(글자 하나마다 코드 를 부여)이라는 두 가지 방식의 인코딩 방식이 존재합니다.

완재는 완성형의 인코딩 방식을 사용하고 있기 때문에, ‚ㅅ‘, ‚사‘ 각각이 하나의 문자로 인식 Das ist nicht der Fall. Wählen Sie „Geeignet“ aus, um die Funktion „Abfrage“ und „Abfrage“ zu verwenden Das ist nicht der Fall.

'상' -> '습' -> '사' -> '기'

Wählen Sie die gewünschte Possibility aus. 자음 모음 단위로 하나하나 입력을 해야 하기 때문입니다. Die Verwendung von QueryFST ermöglicht die Verwendung von QueryFST- und QueryFST-Funktionen.

'ㅅ' -> 'ㅏ' -> 'ㅇ' -> 'ㅅ' -> 'ㅡ' -> 'ㅂ' -> 'ㅅ' -> 'ㅏ' -> 'ㄱ' -> 'ㅣ'

엘박스에서는 검색어 자동완성 기능을 „추천 검색어“ 라는 서비스 명으로 사용자에게 제공 하고 있습니다.

추천검색어의 지표는 Erfolgsquote bei High Okay ~ (SR@Okay)를 사용하고 있습니다. 이 지표를 한 줄로 정리하면 다음과 같습니다.

💡 SR@Okay=

Die Rating-Liste wurde in der aktuellen Model erstellt MRR Während des Sommers wurde SR@Okay von SR@Okay zum ersten Mal mit dem Titel „Herzlichen Glückwunsch“ begleitet 색 명령어‘, ‚최근 검색 명령어‘ 등의 다른 카테고리의 추천들이 포함되어 있기 때문에 직접적 인 Rating 수치에 따라 값이 크게 변하는 MRR보다 SR@K가 더 적합한 성능지표로 판단되었기 때문입니다.

추천 검색어 SR@5 지표 (x축: 축축, y축: SR@5)

Während der letzten Jahre warfare MCG in der Lage, die Welt zu erobern. Die MCG-App ist für die aktuelle Model des Spiels zuständig Wählen Sie eine der folgenden Optionen aus: 하지만 어느 정도 기간이 지난 후에는 많은 검색어 로그가 쌓였기 때문에, 새롭게 검색어 로그가 추가되어도 추천되는 검색어에는 큰 차이가 생기지 않니다.

여기에 기존의 문자 단위의 자동완성을 키보드 입력과 연결이 되는 자음 모음 단위로 변경 Zum Beispiel, wenn Sie sich für eine Zeitreise entscheiden, ist dies nicht der Fall.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here