사전 훈련 된 BERT를 문장의 의미 적 분리의 또 다른 사용 사례에 적용하려는 시도

debugcn 에 게시 Dev

케이 신선한

나는 매우 좋은 결과를 가진 문장 분류를 위해 huggingface BERT를 사용했지만 이제는 다른 사용 사례에 적용하고 싶습니다. 아래는 내가 염두에두고있는 데이터 세트의 종류 (정확하지 않음)입니다.

 set_df.head()

    sentence                                subject                   object
0   my big red dog has a big fat bone       my big red dog          big fat bone
1   The Queen of Spades lives in a Castle   The Queen of spades     lives in a castle

이 세 열이있는 기차 데이터 세트가 있으며 테스트 문장을 구성 요소로 양분 할 수 있기를 바랍니다. BERT에서 사전 훈련 된 여러 모델을 살펴 봤지만 성공하지 못했습니다. 잘못된 도구를 사용하고 있습니까?

Dennlinger

더 나은 질문은 작업을 구성하는 방법을 구체화하는 것입니다. 실제로 구성 요소가 겹치지 않는 경우 BertForTokenClassification. 기본적으로, 당신의 레이블을 예측하려고하는 각각의 토큰을 귀하의 경우처럼 하나 뭔가를 no label, subject또는 object.

이러한 종류의 작업에 대한 좋은 예 는 일반적으로 유사한 방식으로 구성되는 NER (Named Entity Recognition) 입니다. 특히 HuggingFace의 변환기 저장소에는 입력 형식을 지정하는 방법과 적절한 훈련 방법에 대한 영감을 줄 수 있는 매우 광범위한 예제가 있습니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

사전 훈련 된 BERT를 문장의 의미 적 분리의 또 다른 사용 사례에 적용하려는 시도

사전 훈련 된 BERT를 문장의 의미 적 분리의 또 다른 사용 사례에 적용하려는 시도

R Tidymodels : 다른 데이터 프레임에 별도의 pca (사전 처리 / 레시피)를 적용한 다음 훈련을 위해 병합합니다.

"과적 합"을 방지하는 Pytorch를 사용하여 Faster RCNN (COCO 데이터 세트)에서 훈련 된 최상의 모델을 저장합니다.

사전 훈련 된 모델에 대한 입력으로 다른 차원의 이미지 세트를 사용할 수있는 방법은 무엇입니까?

고도로 최적화 된 선택 쿼리의 경우 SQL Server에서보기 또는 저장 프로 시저를 사용하는 것이 더 낫습니까?

고도로 최적화 된 선택 쿼리의 경우 SQL Server에서보기 또는 저장 프로 시저를 사용하는 것이 더 낫습니까?

Tensoflow Lite / 또는 스마트 폰의 다른 프레임 워크를 사용하여 신경망 모델을 훈련시킬 수 있습니까?

CNN 모델을 훈련시키고이 CNN의 가중치를 저장 한 다음이 가중치를 사용하여 다른 훈련 데이터에 대해이 CNN을 재 훈련하는 방법이 있습니까?

동일한 데이터를 사용하여 훈련 된 두 NN의 상당히 다른 "가중치"및 "편향"

Pytorch의 사전 훈련 된 모델에서 저장된 토크 나이저를로드하는 방법

선택적 유형 'NSNumber'의 값은 풀리지 않습니다. '!'를 사용하려고 하셨나요? 또는 '?'?

라이브러리 또는 사전 정의 된 도우미를 사용하지 않고 Unix 시간을 날짜 및 시간으로 변환

다른 활동에 의도적으로 이미지 ID를 사용하여 이미지를 전달하는 방법은 무엇입니까?

ktrain 텍스트 분류기와 함께 사전 훈련 된 다른 BERT 모델을 사용하는 방법은 무엇입니까?

Tensorflow 사전 훈련 된 CNN : 동일한 클래스의 이미지를 예측합니다.

적절한 (시스템 버전과 다른) 버전의 라이브러리를 사용하도록 내 환경을 구성하는 방법

Python에서 가져온 코드를 사용하여 줄리아의 분산 된 미적분 : UndefVarError : __anon__ not defined

FANN의 기능을 사용하여 훈련시 설정 한 척도 매개 변수에 따라 테스트 데이터를 확장합니다.

훈련 세트의 하위 폴더를 사용하여 Inception의 최종 계층을 다시 훈련 시키십시오.

사전 훈련 된 네트워크 (1 개의 분기)를 사용하여 caffe에 2 개의 분기가있는 네트워크의 계층 가중치를 초기화합니다.

사전 훈련 된 VGG를 사용하는 다중 스트림 CNN

Caffe, AlexNet의 사전 훈련 된 가중치를 두 개의 AlexNet이있는 사용자 지정 네트워크에 복사

awk 또는 sed를 사용하여 8 미만의 문장에서 단어 또는 숫자를 바꿉니다.

Google지도를 사용하여 실시간으로 다른 사용자의 위치 정보 추적

SQL의 동적 쿼리에서 쉼표로 구분 된 문자열 전달을 사용하는 방법

사전 훈련 된 모델의 첫 번째 레이어를 사용하여 Keras 모델 (Functional API) 내에서 특징을 추출하는 방법

TensorFlow에서 사전 훈련 된 네트워크의 기능 시각화

JavaScript 또는 jQuery를 사용하는 JSP의 동적 연도 달력

autoconf에 다른 버전의 gcc를 사용하도록 지시하십시오.

LFW를 사용하여 Dlib의 얼굴 감지기 훈련

Python에서 가져온 코드를 사용하여 줄리아의 분산 된 미적분 : UndefVarError : anon not defined