知识点卡片:AI4Science
基本信息
| 属性 | 内容 |
|---|---|
| 知识点 | AI for Science (科学AI) |
| 掌握程度 | ★★★☆☆ |
| 学习优先级 | P2 |
| 预估时间 | 6小时 |
| 面试频率 | ★★☆☆☆ |
核心应用领域
1. AlphaFold - 蛋白质结构预测
DeepMind (2021-2024)
任务:从氨基酸序列预测蛋白质3D结构
核心技术:
- Evoformer:利用MSA(多序列比对)和结构信息
- IPA(Invariant Point Attention):3D几何等变注意力
- Recycling:迭代精炼预测
成果:
- 预测了2亿+蛋白质结构
- 解决了50年的科学难题
- 2024诺贝尔化学奖2. 药物发现
python
"""
AI加速药物发现Pipeline:
1. 靶点识别
- 从基因组/蛋白质组数据中寻找药物靶点
- 深度学习识别疾病相关蛋白质
2. 分子生成
- 生成具有特定性质的候选分子
- 模型:MolGPT, JT-VAE
3. 属性预测
- 预测分子的ADMET性质
(吸收/分布/代谢/排泄/毒性)
4. 分子对接
- 预测分子与靶点的结合方式
- DiffDock: 扩散模型用于分子对接
"""3. 材料科学
应用:
- 晶体结构预测
- 新材料设计(电池/催化剂/半导体)
- 材料性质预测(稳定性/导电性/磁性)
代表工作:
- GNoME (DeepMind):发现220万种新晶体结构
- Matformer:材料性质的图神经网络预测核心技术挑战
| 挑战 | 说明 |
|---|---|
| 数据稀缺 | 科学数据标注成本极高 |
| 物理约束 | 需要满足守恒律/对称性 |
| 多尺度 | 从原子到宏观的跨尺度建模 |
| 可解释性 | 科学家需要理解"为什么" |
| 实验验证 | 预测需要实验验证闭环 |
就业方向
岗位类型:
1. AI制药公司(晶泰科技/英矽智能等)
2. 材料设计初创
3. 科研院所AI部门
4. 科技公司科学AI团队(DeepMind/微软等)
技能要求:
- AI基础 + 领域知识(生物/化学/物理之一)
- 图神经网络/GNN
- 几何深度学习(E(3)/SE(3)等变网络)
- Python科学计算栈
适合:
- 读博/科研优先
- 交叉学科背景优势明显相关知识点
- → Diffusion - 分子生成
- → Transformer
- → 多模态