Pertanyaan Terbaru Tentang Pyspark

2
Jawaban

Bagaimana cara menggabungkan dua kolom di Pyspark tetapi memengaruhi urutan di mana setiap baris digabung?

Saya memiliki bingkai data pyspark yang terlihat seperti contoh di bawah, mengabaikan kolom bernama name, itulah yang perlu saya buat dari kolom sisi 1 dan sisi 2. Masalahnya adalah bahwa nama harus sama terlepas dari apakah sisi 1 berisi A dan sisi 2 B atau sisi 1 B dan sisi 2 A; hasil akhirnya harus A/B jadi menggabungkan kedua kolom tidak akan berfungsi karena nama akan terlihat berbeda A/B -B/A. Saya perlu melakukan grup lebih jauh ke bawah menggunakan kolom nama, itulah sebabnya saya membutuhkan nama untuk dicerminkan dengan benar. Bisakah seseorang menunjukkan kepada saya cara yang dapat saya gunakan untuk melakukan ini.

concatenation pyspark

0
Menjawab

Menampilkan penurunan harga dengan pyspark

Saya memiliki dua kolom dalam bingkai data saya dengan beberapa nilai unik (etnis, status) dan saya ingin melihat nilai dengan kemunculan tertinggi dan menampilkannya dengan rapi. Pada dasarnya terlihat seperti: leastFreqEthnicity (kejadian) MostFreqEthnicity (kejadian), leastFreqStatus (kejadian), mostFreqStatus (kejadian)

markdown pyspark

Tag Populer

© 2021   Pemrograman.Net