[TOC]

贝叶斯分析

探索式数据分析

描述性统计
数据可视化

概率与不确定性

贝叶斯是对逻辑学处理不确定性的补充。
条件概率是统计学中的一个核心概念。概率分布式数学中的一个概念，用来描述不同时间发生的可能性。

![uywexPQ6s7EDlGO](<https://i.loli.net/2020/08/03/uywexPQ6s7EDlGO.png>)

import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
import seaborn as sns
palette = 'muted'
sns.set_palette(palette)
sns.set_color_codes(palette)

mu_params = [-1, 0, 1]
sd_params = [0.5, 1, 1.5]
x = np.linspace(-7, 7, 100)
f, ax = plt.subplots(len(mu_params), len(sd_params), sharex=True, sharey=True)
for i in range(3):
    for j in range(3):
        mu = mu_params[i]
        sd = sd_params[j]
        y = stats.norm(mu, sd).pdf(x)
        ax[i,j].plot(x, y)
        ax[i,j].plot(0, 0,
        label="$\\\\\\\\mu$ = {:3.2f}\\\\n$\\\\\\\\sigma$ = {:3.2f}".format(mu, sd), alpha=0)
        ax[i,j].legend(fontsize=12)
ax[2,1].set_xlabel('$x$', fontsize=16)
ax[1,0].set_ylabel('$pdf(x)$', fontsize=16)
plt.tight_layout()
plt.savefig('B04958_01_01.png', dpi=300, figsize=(5.5, 5.5))

![Yny5hvqHEi9pSbf](<https://i.loli.net/2020/08/03/Yny5hvqHEi9pSbf.png>)

- p(H):先验
    - 先验分布：就是在观测数据之前我们对参数的了解，
- P（D|H） 似然
    - 似然是指如何在实验室分析中引入观测数据，反映的是给定参数下得到某一组观测数据的可信度。
- p（H|D）后验
    - 后验分布：是贝叶斯分析的结果。反映的是在指定数据和模型的条件下我们对问题的全部认知。
- P（D） 证据

n_params = [1, 2, 4]
p_params = [0.25, 0.5, 0.75]
x = np.arange(0, max(n_params)+1)
f, ax = plt.subplots(len(n_params), len(p_params), sharex=True,
  sharey=True)
for i in range(3):
    for j in range(3):
        n = n_params[i]
        p = p_params[j]
        y = stats.binom(n=n, p=p).pmf(x)
        ax[i,j].vlines(x, 0, y, colors='b', lw=5)
        ax[i,j].set_ylim(0, 1)
        ax[i,j].plot(0, 0, label="n = {:3.2f}\\\\np = {:3.2f}".format(n, p), alpha=0)
        ax[i,j].legend(fontsize=12)
ax[2,1].set_xlabel('$\\\\\\\\theta$', fontsize=14)
ax[1,0].set_ylabel('$p(y|\\\\\\\\theta)$', fontsize=14)
ax[0,0].set_xticks(x)
plt.savefig('B04958_01_03.png', dpi=300, figsize=(5.5, 5.5))

PYMC3

import pymc3 as pm

with pm.Model() as model:
    parameter = pm.Exponential("poisson_param", 1.0)
    data_generator = pm.Poisson("data_generator", parameter)