A pd.merge eredmények replikálása az SQL-ben?

szavazat
18

Játszottam néhány adatkészlettel helyben a Python-ban, és most megpróbálom ugyanazokat az eredményeket felhőalapú környezetben megismételni az SQL segítségével.

3 táblám van, mindegyik többszörösen azonosítóval rendelkezik. Az A táblázat például azonosítókat tartalmaz a, b, c, d, ... , a B táblázat azonosítókat fog tartalmazni a, c, e, a1, a2 ... , és a C táblázat azonosítókat fog tartalmazni d, f, a2, b1, b2, ...

Jelenleg csinálok pd.merge az A és a B táblázathoz az azonosítón a és a C táblázat az azonosító első egyesítésének eredményeként létrejövő táblával a2 . A pd.merge használatakor észrevettem, hogy ez hozzáad egy _x vagy a _y a másodpéldányokhoz (ebből az elsőben értem pd.merge az A és a B táblázat c az A táblázatból lesz c_x és c a B táblázatból lesz c_y és így tovább minden másolatos azonosítóhoz. Ugyanez vonatkozna bármely más csatlakozásra vonatkozó másolat azonosítóra.

Hogyan tudnám megismételni ezt a folyamatot és megkerülni a problémát az SQL másolatú azonosítóival?

A kérdést 26/05/2020 03:30
a forrás felhasználó
Más nyelveken...                            


1 válasz

szavazat
0

Azt hiszem, átnevezheti a csatlakozásban a csatlakozott oszlopok többi részét új nevekkel:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Remélem hasznosnak találja.

Válaszolt 10/06/2020 15:51
a forrás felhasználó

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more