Creación de Azure Databricks Notebook
En el post anterior vimos como crear un cluster en azure databricks. Pero para poder ejecutar consultas sobre el , necesitamos un notebook interactivo que sirva de interfaz para escribir y ejecutar el código.
Un notebook es un documento en el cual puedes ingresar código “en vivo”. Es decir, escribir una consulta sobre tus datos y obtener resultados a través de gráficos. Esto es de mucha utilidad, ya que puedes ver todos las consultas que haz realizado y sus respectivos resultados, permitiéndote realizar una exploración y experimentación de manera más dinámica y amigable.
Iniciar el Cluster
Primero vamos a asegurarnos de que nuestro cluster esté iniciado. Así que en el panel izquierdo haz clic en Cluster.
Dado que el cluster que habiamos creado, lo teniamos cofigurado para que se apague después de 120 minutos de inactividad, tenemos que ubicarnos sobre el y entrar a su panel de configuración para iniciarlo:
Una vez dentro, haz clic en Start
Y esperamos unos minutos a que cambie de estado desde Terminated > Pending > Running. Y así nos aseguramos que el cluster ya esté disponible.
Creación de un notebook
La forma más rápida de crear un notebook es desde la pantalla principal del portal de azure databricks. Aquí debes hacer clic en New Notebook:
O en caso no la encuentres, puedes ir a Workspace, hacer clic en el menú desplegable, clic en Create y clic en Notebook
Coloca un nombre amigable y en lenguaje tenemos varias opciones como Python, Scala, SQL o R. Elige SQL, selecciona el cluster que hemos iniciado y finalmente clic en Create.
Y con estos pasos ya tendremos nuestro nuevo notebook en azure databricks listo para ser usado.
0 Comentarios