View difference between Paste ID: VRkhixnt and mpv8Vnpd
SHOW: | | - or go back to the newest paste.
1-
--Загрузите датафрейм из файла /datasets/pickups_terminal_5.csv. Посмотрите в документации, как работает функция show(). Напечайте на экране пять строк из датафрейма.
1+
--Методом show() размер датасета не получить. Найдите в документации функцию, которая посчитает количество строк. Напечайте результат на экране.
2
3
import numpy as np
4
import pandas as pd
5
from pyspark.sql import SparkSession
6
7
APP_NAME = "DataFrames"
8
SPARK_URL = "local[*]"
9
10
spark = SparkSession.builder.appName(APP_NAME) \
11
        .config('spark.ui.showConsoleProgress', 'false') \
12
        .getOrCreate()
13
14-
taxi = spark.read.load('/datasets/pickups_terminal_5.csv', format='csv', header='true', inferSchema='true')
14+
taxi = spark.read.load('/datasets/pickups_terminal_5.csv', 
15
                       format='csv', header='true', inferSchema='true')
16-
print(taxi.show(5))
16+
17
print(taxi.count())