From a9714d31cfbf479d0ff0aa6edbd95380f37c0c1b Mon Sep 17 00:00:00 2001 From: Matt McKay Date: Fri, 19 Jun 2026 04:08:01 +0100 Subject: [PATCH 1/4] Update translation: lectures/pandas.md --- lectures/pandas.md | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/lectures/pandas.md b/lectures/pandas.md index 52da964..b036fea 100644 --- a/lectures/pandas.md +++ b/lectures/pandas.md @@ -282,7 +282,7 @@ df.loc[(df.cc + df.cg >= 80) & (df.POP <= 20000), ['country', 'year', 'POP']] **应用:对数据框进行子集化** -现实世界的数据集可能[非常庞大](https://developers.google.com/machine-learning/crash-course/overfitting)。 +现实世界的数据集可能 [非常庞大](https://developers.google.com/machine-learning/crash-course/overfitting)。 有时需要使用数据的子集来提高计算效率并减少冗余。 @@ -360,10 +360,10 @@ df.loc[complexCondition] 修改数据框的能力对于生成用于未来分析的干净数据集非常重要。 -**1.** 我们可以方便地使用 `df.where()` 来"保留"我们已选择的行,并用任何其他值替换其余行: +**1.** 我们可以方便地使用 `df.where()` 来"保留"我们已选择的行,并将其余行替换为 `NaN`: ```{code-cell} ipython3 -df.where(df.POP >= 20000, False) +df.where(df.POP >= 20000) ``` **2.** 我们可以简单地使用 `.loc[]` 来指定我们想要修改的列,并赋值: @@ -433,7 +433,7 @@ df 缺失值插补是数据科学中的一个大领域,涉及各种机器学习技术。 -Python 中还有更多[高级工具](https://scikit-learn.org/stable/modules/impute.html)可用于插补缺失值。 +Python 中还有更多 [高级工具](https://scikit-learn.org/stable/modules/impute.html) 可用于插补缺失值。 ### 标准化与可视化 From e55dcbbf989097e77f2070f6730b0b9c21863f84 Mon Sep 17 00:00:00 2001 From: Matt McKay Date: Fri, 19 Jun 2026 04:08:02 +0100 Subject: [PATCH 2/4] Update translation: .translate/state/pandas.md.yml --- .translate/state/pandas.md.yml | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/.translate/state/pandas.md.yml b/.translate/state/pandas.md.yml index 909f017..501d62e 100644 --- a/.translate/state/pandas.md.yml +++ b/.translate/state/pandas.md.yml @@ -1,6 +1,6 @@ -source-sha: 02e57a5befc2a9a081019edc748aba15e4b2f02a -synced-at: "2026-04-09" +source-sha: 811accdd4ed8803df3a7123ada3b560bc3110712 +synced-at: "2026-06-19" model: claude-sonnet-4-6 mode: UPDATE section-count: 5 -tool-version: 0.14.0 +tool-version: 0.15.0 From 3ea9e78e84513ab9410023f0bca8d6cab7bb982f Mon Sep 17 00:00:00 2001 From: Matt McKay Date: Fri, 19 Jun 2026 04:08:03 +0100 Subject: [PATCH 3/4] Update translation: lectures/pandas_panel.md --- lectures/pandas_panel.md | 12 ++++++------ 1 file changed, 6 insertions(+), 6 deletions(-) diff --git a/lectures/pandas_panel.md b/lectures/pandas_panel.md index ebc300f..42b299c 100644 --- a/lectures/pandas_panel.md +++ b/lectures/pandas_panel.md @@ -152,13 +152,13 @@ realwage['United States'].head() `.stack()` 将列 `MultiIndex` 的最低层级旋转到行索引(`.unstack()` 方向相反——可以尝试一下) ```{code-cell} ipython3 -realwage.stack(future_stack=True).head() +realwage.stack().head() ``` 我们也可以传入参数来选择要堆叠的层级 ```{code-cell} ipython3 -realwage.stack(level='Country', future_stack=True).head() # pandas>3.0 之前需要 future_stack=True +realwage.stack(level='Country').head() ``` 使用 `DatetimeIndex` 可以方便地选择特定时间段。 @@ -166,7 +166,7 @@ realwage.stack(level='Country', future_stack=True).head() # pandas>3.0 之前 选择某一年并堆叠 `MultiIndex` 的两个较低层级,可以创建面板数据的横截面 ```{code-cell} ipython3 -realwage.loc['2015'].stack(level=(1, 2), future_stack=True).transpose().head() # pandas>3.0 之前需要 future_stack=True +realwage.loc['2015'].stack(level=(1, 2)).transpose().head() ``` 在本讲座的其余部分,我们将使用一个包含各国和各时间段每小时实际最低工资的数据框,以 2015 年美元计价。 @@ -363,7 +363,7 @@ plt.show() 我们还可以指定 `MultiIndex` 的某个层级(在列轴上)进行聚合。 -对于 `groupby`,由于 pandas 已弃用在 `groupby` 方法中使用 `axis=1`,我们需要使用 `.T` 将列转置为行。 +对于 `groupby`,由于 `pandas` 已移除在 `groupby` 方法中使用 `axis=1` 的支持,我们需要使用 `.T` 将列转置为行。 ```{code-cell} ipython3 merged.T.groupby(level='Continent').mean().head() @@ -393,7 +393,7 @@ plt.show() `.describe()` 可用于快速检索多个常用汇总统计量 ```{code-cell} ipython3 -merged.stack(future_stack=True).describe() +merged.stack().describe() ``` 这是使用 `groupby` 的一种简化方式。 @@ -563,4 +563,4 @@ plt.show() ``` ```{solution-end} -``` \ No newline at end of file +``` From 1e8d62428223cff51afc355d2e699ad4cb5ec8f4 Mon Sep 17 00:00:00 2001 From: Matt McKay Date: Fri, 19 Jun 2026 04:08:03 +0100 Subject: [PATCH 4/4] Update translation: .translate/state/pandas_panel.md.yml --- .translate/state/pandas_panel.md.yml | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/.translate/state/pandas_panel.md.yml b/.translate/state/pandas_panel.md.yml index 08c9eb1..b50f3db 100644 --- a/.translate/state/pandas_panel.md.yml +++ b/.translate/state/pandas_panel.md.yml @@ -1,6 +1,6 @@ -source-sha: 126eb49056ad1b685638c1820ebb7b4c89cabf89 -synced-at: "2026-03-20" +source-sha: 811accdd4ed8803df3a7123ada3b560bc3110712 +synced-at: "2026-06-19" model: claude-sonnet-4-6 -mode: NEW +mode: UPDATE section-count: 6 -tool-version: 0.13.0 +tool-version: 0.15.0