1. Azure Databricks CLI 설치하기
Azure Databricks CLI 설치하기
개요
Databricks는 사용자가 쉽게 접근할 수 있도록 Interface Platform을 제공하고 있습니다. Workspace API, Cluster API, DBFS API, Groups API, Jobs API, Libraries API와 Secrets API를 통해서 Databricks에 설정을 유연하게 Config나 작업을 할 수 있습니다~
저는 Windows에 Anaconda 가상 환경에서 진행했구요 Python version은 3.7입니다!
Requirements
Python 3 -3.6 and Above
Python 2 -2.7.9 and Above
설치 과정
1. Module Install
pip으로 모듈을 받습니다.
>pip install databricks-cli
----------------------CMD---------------------------------
(mingdi) C:\Users\박민지>pip install databricks-cli
Collecting databricks-cli
Downloading https://files.pythonhosted.org/packages/5f/38/f83bc71c5e7351a03e8d44aaf04647d076bbf8f097e3f93b921704b7a74c/databricks_cli-0.8.7-py3-none-any.whl (82kB)
|████████████████████████████████| 92kB 226kB/s
2. Authentication Set UP
Databricks에 인증을 등록해야하는데요, 일단 Databricks로 들어갑니다.
Databricks 포탈에 맨 오른쪽에 요렇게 사람모양 표시가 있는데 그걸 눌러 User Settings로 들어갑니다.
Comment에 원하는 걸 기입하시고 Generate하시면 됩니다.
단, 여기서 새로운 Token을 미리 복사를 해야합니다. 다시는 못보거든요..
요런식으로 Generate 된 Token을 확인할 수 있습니다.
다시 여기서 CMD 창으로 돌아갈게요~
3. Configure Authentication
Token을 Configure합니다.
여기서 중요한건 host는 생성한 Databricks에 Location.azuredatabrick.net으로 설정해주어야 합니다.
https : // <location> .azuredatabricks.net token = <personal-access-token>
C:\Users\박민지>databricks configure --token
Databricks Host (should begin with https://): https://eastus.azuredatabricks.net
Token: dapib851f5aa3b2f46278d0e5eee0e976946
이제 Profile도 Config 해줍니다.
C:\Users\박민지>databricks configure --profile mingdi
Databricks Host (should begin with https://): https://mingdi
Username: mingdi
Password:
Repeat for confirmation:
4. Databricks CLI Example
그렇담 이제 cli로 workspace list를 확인해볼까요?
C:\Users\박민지>databricks workspace ls /Users/mj2727@cloocus.com
codes
applications
2019-06-17 - Azure Data Lake Store Import Example
네 요렇게 cmd창에서 databricks REST API 사용하여 확인 할 수 있습니다!
사실 이렇게 databricks cli를 구성한 큰 이유는 secret scope을 설정해서 Azure에서 생성된 리소스에 접근을 용이하게 할 수 있습니다 ~ 그건 따로 준비할게요.
댓글
댓글 쓰기