2. Azure Databricks - Azure Key Vault 연동하기.
Azure Databricks with Key Vault 연동
개요
Databricks는 Apache Spark 클러스터를 MS Azure Cloud 위에서 사용할 수 있는 PaaS형 서비스 입니다. 여기서! Blob Storage나 Data Lake Storage, Data Warehouse에 데이터 소스를 Cluster 위에 올려서 작업을 해야 할 경우에 Key Vault를 연동하게 되면 Mount하여 데이터를 올려 사용할 수 있습니다. 그 작업 프로세스 부분을 정리해보았어용~
연동 작업
1. Azure Key-Vault 생성
키 자격 증명 모음에 추가하여 새로 생성합니다.
생성이 다 되었으면 그 리소스 클릿하시고 왼쪽 아래에 속성을 선택합니다. 그러면 아래와 같이 뜨는데요, 저희가 필요한건 DNS 이름과 리소스 ID입니다!
2. Databricks에서 createScope 생성
Databricks 포털 URI에서 /#secrets/createScope 를 붙이시면 해당 페이지가 나와용.
https://<location>.azuredatabricks.net/#secrets/createScope
위에 만들어 두었던 Key-Vault에 DNS이름과 리소스 ID를 해당 칸에 붙여넣습니다.
3. Databricks에서 Secret Scope 생성 완료 확인
생성이 다 되었다면 이제 Scope 생성이 완료되었는지 확인해볼게요.
Databricks CLI를 사용하기 위해 CMD 창을 켭니다. (Databricks CLI 설치는 이미 포스팅 해놨습니다! 참고 부탁 ㅋㅋ)
(mingdi) C:\Users\박민지>databricks secrets list-scopes
Scope Backend
------- --------------
test1 AZURE_KEYVAULT
test2 AZURE_KEYVAULT
요렇게 Backend가 AZURE_KEYVAULT로 확인할 수 있고 SCOPE이 생성이 되었네요.
앞으로 요 Scope으로 Azure 리소스 Data Warehouse나 Storage를 쉽게 ETL 할 수 있을 것 같아요!
4. Secret 생성 및 연동
1번에서 생성한 Azure Key Vault에 추가로 Secret을 생성해야 합니다.
Databricks CLI로 3번에서 만든 Scope에 해당되는 key를 한번 확인해볼까요?
C:\Users\박민지>databricks secrets list --scope test1
Key name Last updated
---------- --------------
Scope만 만들어 주었기 때문에 현재 아무것도 보이지가 않습니다.
여기서 다시 Azure Portal로 돌아갈게요.
Azure Key-Vault에 비밀을 선택하여 +생성/가져오기를 선택합니다.
Secret을 생성할 건데요.
이름과 값에 아래와 같이 기입합니다.
- 업로드 옵션: 수동.
- 이름: ExamplePassword.
- 값: hVFkk965BuUv
네, 이제 Azure Key Vault 비밀을 생성했고 다시 Databricks CLI로 들어가서 생성한 Scope에 Key가 잘 붙었는지 확인해볼게요.
(mingdi) C:\Users\박민지>databricks secrets list --scope test1
Key name Last updated
--------------- --------------
ExamplePassword 156081-
이렇게 자동으로 Databricks와 Azure Keyvault와 연동을 해두었기 때문에 Secret이 자동으로 붙은 것을 확인할 수 있습니다!
다음 포스팅에서 Blob을 Mount해보는 것을 해볼게요~
댓글
댓글 쓰기