두 개의 이미지 입력을 포함하는 네트워크를 구축하려고합니다. 각 이미지는 병합하여 하나의 출력을 제공하는 후기 융합과 동시에 네트워크를 통과합니다. 나는 내가 필요한 것을 보여주기 위해 아래 다이어그램을 사용합니다 (ps : 미안 해요 내 영어가 그렇게 좋지 않습니다)
내 네트워크는 풀 5까지 두 번 정의 된 정확한 AlexNet을 포함하는 caffe prototxt 모델 정의 파일에 정의되어 있습니다. 첫 번째 네트워크의 경우 계층은 AlexNet 과 동일한 이름을 가지며 두 번째 네트워크의 경우 각 계층 이름에 "_1" 접미사를 추가했습니다 . 내 질문은 미리 설정된 무게를 어떻게 복사 할 수 있습니까?
예 : 각 네트워크의 컨볼 루션 레이어 1은 다음과 같습니다. 에 대한주의 conv1
레이어 이름이 pretrained 모델의 것과 동일하기 때문에 pretrained 무게를 쉽게 복사 할 수 있습니다. 그러나 conv1_1
동일한 것이 다르므로 사전 훈련 된 가중치를 복사 할 수 없습니다. 아니면 레이어 이름이 다른 경우에도이를 수행 할 수있는 방법이 있습니까?
layer {
name: "conv1"
type: "Convolution"
bottom: "data1"
top: "conv1"
param {
lr_mult: 0
decay_mult: 1
}
param {
lr_mult: 0
decay_mult: 0
}
convolution_param {
num_output: 96
kernel_size: 11
stride: 4
weight_filler {
type: "gaussian"
std: 0.01
}
bias_filler {
type: "constant"
value: 0
}
}
}
layer {
name: "conv1_1"
type: "Convolution"
bottom: "data2"
top: "conv1_1"
param {
lr_mult: 0
decay_mult: 1
}
param {
lr_mult: 0
decay_mult: 0
}
convolution_param {
num_output: 96
kernel_size: 11
stride: 4
weight_filler {
type: "gaussian"
std: 0.01
}
bias_filler {
type: "constant"
value: 0
}
}
}
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다