그리스의 연구자들은 연합 학습을 사용하여 프로슈머 계획을 위한 PV 예측 기술을 개발했습니다. 연합 학습은 로컬 모델 업데이트를 중앙 서버로 보내 수정하는 머신 러닝 방법입니다. 그들의 시뮬레이션은 중앙 집중식 예측과 비교했을 때 놀라운 결과를 보여줍니다.

이미지: Blue Coat Photos, Flickr, CC BY-SA 2.0
그리스 아테네 국립기술대학의 과학자들은 프로슈머의 프라이버시를 보호하는 새로운 PV 예측 기술을 제안했습니다. 효율적인 프로슈머 계획은 광범위한 데이터가 필요한 정확한 태양열 생산 예측 모델에 의존하므로 프라이버시와 유틸리티의 트레이드오프가 필수적입니다. 이 트레이드오프의 균형을 맞추기 위한 연구자들의 접근 방식은 연합 학습(FL)을 기반으로 합니다.
"FL 프로세스는 모든 기기와 공유되는 글로벌 모델로 시작합니다. 각 기기는 로컬에서 모델을 훈련하고 업데이트를 중앙 서버로 보내 모델을 개선하기 위해 집계합니다." 학자들은 말했습니다. "이 업데이트된 모델은 추가 훈련을 위해 기기에 다시 배포됩니다. FL 사이클은 글로벌 모델이 원하는 최적의 정확도를 달성할 때까지 여러 번 반복됩니다."
팀의 모델은 각 머신에서 로컬로 실행되며 LSTM(장단기 메모리) 아키텍처, 드롭아웃 유닛, 두 개의 완전히 연결된 밀집 레이어를 포함합니다. LSTM은 순차적 데이터를 처리하는 반면, 드롭아웃 유닛은 과적합을 줄이고, 밀집 레이어는 최종 예측을 하는 데 도움이 됩니다.
이 모델은 또한 하이퍼파라미터를 사용하여 로컬 LSTM 모델을 조정하고 중앙 서버에서 유사한 클라이언트를 클러스터링합니다. 이러한 하이퍼파라미터는 학습이 시작되기 전에 설정되며 머신 러닝 모델의 학습 프로세스를 제어합니다.
기타 모델
"조사 중인 데이터 세트는 이탈리아 테르니의 전력망에서 얻은 것으로, 태양광 시스템을 에너지 생산에 활용하는 30개의 소규모 전기 프로슈머의 데이터로 구성되어 있습니다."라고 그룹은 설명했습니다. "정규화 후, 데이터 세트를 두 개의 하위 세트로 나눕니다. 모델 학습을 위한 학습 세트와 보이지 않는 데이터에 대한 모델 성능을 평가하기 위한 테스트 세트입니다. 이 구분은 80-20 분할을 따르며, 2015년 2017월부터 2018년 2019월까지의 데이터는 학습에 지정되고 XNUMX년 XNUMX월부터 XNUMX년 XNUMX월까지의 데이터는 테스트에 할당됩니다."
그런 다음 연구자들은 동일한 데이터 세트에서 FL-LSTM 모델을 여러 학습 방법과 비교했습니다. 첫 번째는 완전히 개인적이고 지역화된 환경에서 작동하는 지역화된 학습이었습니다. 두 번째는 일반적으로 더 높은 정확도를 제공하지만 개인 정보를 희생하는 중앙화된 학습이었습니다. 세 번째 모델은 0.2, 0.25, 0.3 또는 0.4로 설정된 노이즈 승수를 사용하여 개별 기여도를 식별할 가능성을 최소화하기 위해 차등 개인 정보 보호(DP)로 강화된 FL이었습니다.
"모델의 성능을 평가하기 위해 두 가지 핵심 지표가 활용됩니다. 평균 절대 오차(MAE)와 평균 제곱근 오차(RMSE)"라고 그룹은 설명했습니다. "MAE를 선택하면 모델의 오차 한계를 포괄적으로 살펴볼 수 있습니다. 특히 이상치에 대한 견고성으로 인해 그렇습니다. 이는 데이터 세트의 주목할 만한 특징입니다. 반대로 RMSE는 더 큰 오차에 대한 민감도를 강조하는데, 이는 발전 예측의 정확성을 평가하는 데 매우 중요합니다. MAE보다 상당한 편차의 영향을 더 강조하기 때문입니다."
결과에 따르면 중앙 집중형 모델이 MAE 0.00960, RMSE 0.01687로 가장 좋은 성과를 보였습니다. FL 모델의 MAE는 0.01993, RMSE는 0.02872였습니다. 노이즈 승수가 0.2인 FL-DP 모델은 MAE가 0.01857, RMSE가 0.02669였습니다. 국소형 모델은 MAE가 0.02436, RMSE가 0.04679였고, 노이즈 승수가 0.25인 FL-DP 모델은 MAE가 0.02651, RMSE가 0.03375였습니다. 노이즈 승수가 0.3과 0.4인 경우의 결과는 제공되지 않았습니다.
"비DP FL 구현과 유사한 성능을 제공하는 노이즈 레벨을 찾는 과정에서 우리는 흥미로운 이상 현상에 부딪혔습니다. 최적의 노이즈 대 성능 비율은 노이즈 승수 0.2에서 관찰되었는데, 이는 예상치 못하게 FL보다 더 나은 결과를 가져왔습니다."라고 그룹은 언급했습니다. "0.2보다 높은 노이즈 승수를 사용한 실험은 승수 0.4에서 예측 정확도가 저하되어 모델이 수렴할 수 없음을 보여주었습니다."
그룹은 "주요 제약은 참여 클라이언트 수와 관련된 데이터 세트의 제한된 크기입니다. 이 연구는 기준선 역할을 합니다. 시간이 지남에 따라 더 많은 프로슈머를 추가하면 FL과 FL-DP의 성능이 확실히 향상될 것입니다. 이를 염두에 두고, 우리의 결과는 참여 클라이언트가 적은 소규모 데이터 세트의 경우 중앙 집중식 학습이 정확도 측면에서 FL보다 우수하다는 것을 나타냅니다. 두 접근 방식 모두 사용 가능한 집합적 데이터를 활용합니다. 그럼에도 불구하고 FL은 개인 정보 보호 및 통신 비용과 관련하여 이점을 제공합니다."
그들은 최근 출판된 "개인정보 보호 PV 예측을 위한 연합 학습 기술 강화"에서 결과를 발표했습니다. 에너지 보고서.
이 콘텐츠는 저작권으로 보호되며 재사용할 수 없습니다. 저희와 협력하고 저희 콘텐츠 중 일부를 재사용하고 싶으시다면 editors@pv-magazine.com으로 연락해 주세요.
출처 pv 잡지
면책 조항: 위에 제시된 정보는 Cooig.com과 독립적으로 pv-magazine.com에서 제공합니다. Cooig.com은 판매자와 제품의 품질과 신뢰성에 대해 어떠한 진술 및 보증도 하지 않습니다. Cooig.com은 콘텐츠의 저작권과 관련된 위반에 대한 모든 책임을 명시적으로 부인합니다.