数据分析、建模与报告整理
R 语言数据分析与计算社会科学研究原型
用 R 组织课程与研究实践,覆盖财富分配 LSTM 预测、政治经济学文本量化、随机森林和 CORD-19 NLP 教学示范。
项目简介
syllabus_R 是一个围绕 R 语言课程、课堂练习和计算社会科学研究原型的项目库。它不是单一包,而是多个主题相近的 R 项目集合。
技术栈
- R / tidyverse / dplyr / ggplot2
- torch / LSTM
- randomForest / PDP
- Shiny / RMarkdown / plotly / DT
我的工作
我整理了多个 R 项目:财富分配 LSTM 预测、政治经济学 NLP 指标建模,以及 CORD-19 文献 NLP 教学示范。
方法与实现
财富分配项目使用全球面板数据训练多变量 LSTM,预测 2025-2034 年主要经济体的不平等和贫困指标;政治经济学 NLP 项目将政治文本中的经济焦虑量化,并与宏观变量结合做随机森林和 PDP 分析。
难点与解决
这类项目的难点是从课程练习走向研究原型:数据清洗、模型训练、可解释分析和报告呈现需要形成闭环。
复盘
后续可以把其中的 LSTM 预测和 SOTU 文本量化分别拆成更完整的博客文章或研究项目页。