logo

Како комбиновати два оквира података у Питхон-у - Пандас

Панде

Пандас је уграђена библиотека у Питхон-у која се користи за рад са релационим подацима у програмском језику Питхон. Има пуно функција и структура података које помажу у операцијама релационих података.

Ако су подаци ускладиштени у облику редова и колона или дводимензионални подаци се генерално називају оквири података у пандама.

Ако имамо два оквира података, онда уз помоћ панди можемо да их комбинујемо или спојимо у један оквир података. Панде пружају логику скупа за комбиновање података два различита оквира података, као и логику за њихово поређење.

1. Коришћење функције цонцат().

У Питхон-у можемо спојити два оквира података уз помоћ функције цонцат() Пандас-а. Можемо спојити податке било у редовима или у колонама. Ова функција обједињује податке на једној оси (ред или колону) и изводи логику постављања на другој оси (другом индексу).

Пример:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'DEF', 'GHI'], 'Marks':[65,69,96,89]}) # Second DataFrame dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'Name': ['XYZ', 'TUV', 'MNO', 'JKL'], 'Marks':[56,96,69,98]}) frames = [dataFrame1, dataFrame2] result = pd.concat(frames) display(result) 

Излаз:

Како комбиновати два оквира података у Питхон-у - Пандас

Објашњење:

У горњем коду, прво смо увезли Пандас библиотеку у датотеку. Затим смо креирали два оквира података где сваки оквир података садржи три колоне и четири реда. Затим смо користили функцију цонцат, која спаја ова два оквира података у редовима, и са функцијом приказа, ово смо одштампали на екрану.

2. Коришћење спојева у пандама

Разумели смо концепт спајања у бази података где спајамо две табеле на основу неког заједничког атрибута. Исти метод је применљив у везивању оквира података. У једноставној методи цонцат(), спојили смо све редове један у други и креирали нови оквир података. У спајању дефинишемо који тип спајања желимо да изведемо на табели, да ли је то унутрашње или спољашње спајање. Било који тип спајања, било унутрашње спајање (укрштање) или спољашње спајање (унија), биће дефинисано у атрибуту придруживања.

Пример:

прилагођени изузетак у Јави
 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=1, join='inner') display(result) 

Излаз:

Како комбиновати два оквира података у Питхон-у - Пандас

Објашњење:

У горњем коду имамо два дарафраме-а који оба садрже две колоне и четири реда. Оба оквира података имају различита имена колона, а у функцији цонцат() користили смо унутрашње спајање, које заузима део пресека.

У атрибуту акис смо иницијализовали вредност један, тако да смо добили целе податке.

Пример:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'],'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join='inner') display(result) 

Излаз:

јава полиморфизам
Како комбиновати два оквира података у Питхон-у - Пандас

Пошто не постоји заједнички атрибут и примењено је унутрашње спајање, онда смо као излаз добили празан оквир података. Ако постоји заједнички атрибут у оба оквира података:

Пример:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'Name': ['ABC', 'PQR', 'TUV', 'JKL']}) dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'City': ['NOIDA', 'JAIPUR', 'MANALI', 'DELHI'], 'Age': ['11', '10', '12', '17']}) # the default behaviour is join='outer' # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join='inner') display(result) 

Излаз:

Како комбиновати два оквира података у Питхон-у - Пандас

Објашњење:

У горњем коду имамо један атрибут, 'ид', који је уобичајен тако да се оквир података креира само на основу заједничких атрибута.

3. Коришћење методе аппенд().

Уместо методе цонцат(), можемо користити методу аппенд(). Ова метода аппенд() се примењује на један од оквира података.

Пример:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({'id': ['A1', 'A2', 'A3', 'A4'], 'City': ['JAIPUR', 'MANALI', 'NOIDA', 'LUCKNOW']}) # Second DataFrame dataFrame2 = pd.DataFrame({'id': ['B1', 'B2', 'B3', 'B4'], 'City': ['MUMBAI', 'UDAIPUR', 'RISHIKESH', 'KASHMIR']}) # append method result = dataFrame1.append(dataFrame2) display(result) 

Излаз:

Како комбиновати два оквира података у Питхон-у - Пандас

Објашњење:

У горњем коду смо спојили два оквира података помоћу методе додавања.