다양한 크기의 입력 데이터를 신경망에 공급하는 좋은 방법은 무엇입니까? (텐서 플로우)

debugcn 에 게시 Dev

샌드 박스

내 데이터는 다음과 같습니다. 그것들은 float이고 큰 배열 [700000,3]에 있습니다. 빈 필드가 없습니다.

Label   | Values1   | Values2
1.      | 0.01      | 0.01
1.      | ...       | ...
1.      |
2.      |
2.      |
3.      |
...

아이디어는 values1 및 values2 집합을 제공하고 분류를 사용하여 레이블을 식별하도록하는 것입니다.

하지만 데이터를 행 단위로 공급하고 싶지는 않지만 레이블 1에 속하는 모든 값 1/2을 세트로 입력합니다 (예 : 처음 3 개 행을 입력하면 [1,0, ...]을 반환해야합니다. 집합으로 다음 2 개 행 [0,1, ...])

이런 방식으로 데이터를 공급하는 복잡하지 않은 방법이 있습니까? (예 : 열 라벨이 1 인 피드 배치)

나는 현재 데이터를 정렬하고 시작에 대한 포인터를 사용하고 다음 행이 현재와 같은지 확인하는 루프를 사용하여 집합의 끝에 대한 포인터를 찾고 해당 배치의 행 수를 얻는 것에 대해 생각하고 있습니다. 그러나 이것은 다소간 입력 순서를 무작위 화하는 것을 방지합니다.

ml4294

당신이 NumPy와 배열에 데이터를 가지고 있기 때문에 (현실을 부르 자 data, 당신이 사용할 수있는

single_digit = data[(data[:,0] == 1.)][: , 1:]

각 행의 0 번째 요소를 숫자 ( 1.이 경우)와 비교하고 레이블이있는 행만 선택합니다 1.. 이 행에서 첫 번째와 두 번째 요소, 즉 Values1 및 Values2를 가져옵니다. 작동 예는 다음과 같습니다. for 루프를 사용하여 데이터 세트에 포함 된 모든 레이블을 반복하고 다음을 사용하여 각 레이블에 대해 numpy 배열을 구성 할 수 있습니다.

single_digit = data[(data[:,0] == label_of_this_iteration)][: , 1:]

그런 다음 이러한 어레이를 네트워크에 공급합니다. 해당 자리 표시 자의 첫 번째 차원을 지정하지 않으면 TensorFlow 내에서 서로 다른 길이의 배치를 쉽게 공급할 수 있습니다.

import numpy as np
# Generate some data with three columns (label, Values1, Values2)
n = 20
ints = np.random.randint(1,6,(n, 1))
dous = np.random.uniform(size=(n,2))
data = np.hstack((ints, dous))
print(data)

# Extract the second and third columns of all rows having the label 1.0
ones = data[(data[:,0] == 1.)][: , 1:]
print(ones)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-20

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

다양한 크기의 입력 데이터를 신경망에 공급하는 좋은 방법은 무엇입니까? (텐서 플로우)

다양한 크기의 입력 데이터를 신경망에 공급하는 좋은 방법은 무엇입니까? (텐서 플로우)

데이터 입력에서 보고서를 양식에 공급하는 방법은 무엇입니까?

다중 작업 설정에서 다중 레이블 데이터를 HDF5 입력으로 공급하는 방법은 무엇입니까?

외부 Java 애플리케이션에서 Drools BRMS로 데이터를 공급하고 데이터를 다시 가져 오는 방법은 무엇입니까?

http를 통해 Angular에서 Express로 방대한 양의 데이터를 보내는 가장 좋은 방법은 무엇입니까?

x_train 및 y_train 변수로 데이터를받는 신경망에서 Python 생성기를 사용하는 방법은 무엇입니까?

Django에서 양식의 임시 데이터를 저장하는 가장 좋은 방법은 무엇입니까?

Python에서 데이터의 신뢰성을 유지하기 위해 데이터를 리샘플링하는 더 좋은 방법은 무엇입니까?

사용자가 업로드 한 CSV 파일의 콘텐츠를 데이터베이스에 저장하는 가장 좋은 방법은 무엇입니까?

일반 자바 스크립트에서 json 데이터로 양식 입력 데이터를 필터링하는 방법은 무엇입니까?

Unity3D Android에서 많은 양의 데이터를 로컬에 저장하는 가장 좋은 방법은 무엇입니까?

장고에서 모달로 데이터를 공급하는 방법은 무엇입니까?

한 셀에서 다양한 셀로 데이터를 전송 / 분배하는 매크로를 만드는 방법은 무엇입니까?

for 문에서 한 배열의 크기를 계산하는 더 좋은 방법은 무엇입니까?

동적으로 생성 된 입력에서 양식 데이터를 POST하는 방법은 무엇입니까?

데이터 지속성없이 Django에서 양식 크기를 조정하는 가장 좋은 방법 : 가장 Djangonic 방법은 무엇입니까?

많은 양의 데이터를 어레이에 저장하는 가장 좋은 방법은 무엇입니까?

C ++ 파일에서 데이터를 입력 / 출력하는 가장 좋은 방법은 무엇입니까?

SQL 데이터베이스에서 데이터를 출력하는 더 좋은 방법은 무엇입니까?

iOS 애플리케이션의 여러 뷰 컨트롤러에서 일부 데이터를 공유하는 가장 좋은 방법은 무엇입니까?

API의 데이터로 복잡한 개체를 채우는 가장 좋은 방법은 무엇입니까?

기존 양식 데이터를 유지하면서 JavaScript로 양식에 입력 노드를 추가하는 방법은 무엇입니까?

선택한 항목의 컬렉션에서 한 페이지에서 다른 페이지로 데이터를 출력하는 방법은 무엇입니까?

C에서 한 모듈의 텍스트,로 데이터, 데이터 및 BS 크기를 계산하는 방법은 무엇입니까?

WPF에서 응용 프로그램의 다양한 상태에 대한 신호등 색상을 구현하는 가장 좋은 방법은 무엇입니까?

jquery에서 제출 한 PHP 양식 GET 데이터를 다른 자바 스크립트 코드 및 URL로 에코하는 방법은 무엇입니까?

Pytorch에서 신경망을 하위 네트워크로 분할하는 방법은 무엇입니까?

Matlab의 큰 샘플 세트에서 신경망을 훈련하는 방법은 무엇입니까?

여러 테이블 / 하나의 데이터베이스에서 뷰로 데이터를 전달하는 가장 좋은 방법은 무엇입니까?

두 개의 서로 다른 http 끝점에서 데이터를 가져 오는 가장 좋은 방법은 무엇입니까?