Al igual que
SparkContext lo ultilizamos para trabajar con spark, para trabajar con Streaming en spark tenemos
StreamingContext que es el principal punto de entrada para todas las
funciones de transmisión.
Usando este contexto
podemos crear un DStream que representa datos de streaming desde un
destino TCP, especificando el hostname y el puerto. Por ejemplo si
queremos utilizar una herramienta como Ncat para probar Spark
Streaming, recibiríamos una secuencia de datos de la máquina donde
se está ejecutando Ncat (por ejemplo, localhost) y el número de
puerto de 9999.
Tengamos en cuanta
que Spark funciona de modo perezoso, de tal manera cuando
configuramos el cálculo que realizará cuando se inicie, y no
cuando se vaya configurando.
Para iniciar el
procesamiento (después de que se hayan configurado todas las
transformaciones) llamamos al método start() para iniciar el cómputo
y al método awaitTermination() para esperar a que finalice.