逆Ising问题及其求解方法

引言

逆Ising问题涉及从观测数据中推断Ising模型的参数。Ising模型是一种简单的数学模型，用于描述磁性材料中的自旋系统。解决逆Ising问题的方法包括极大似然估计（MLE）、蒙特卡罗方法（MCMC）、平均场近似、伪似然估计（PLE）以及对比散度（CD）。

极大似然估计（MLE）

步骤

定义Hamiltonian: H(s) = −∑_i < jJ_ijs_is_j
定义配分函数: Z = ∑_se^−H(s)
定义似然函数: $L (J) = \prod_{k = 1}^{N} P (s^{(k)} | J) = \prod_{k = 1}^{N} \frac{e^{- H (s^{(k)})}}{Z}$
取对数似然函数: $\log L (J) = - \sum_{k = 1}^{N} H (s^{(k)}) - N \log Z$
优化对数似然函数: 使用数值优化方法（如梯度下降）最大化对数似然函数。

示例代码

import numpy as np
from scipy.optimize import minimize

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 定义Hamiltonian
def hamiltonian(J, s):
    return -J * s[0] * s[1]

# 定义配分函数
def partition_function(J):
    return 2 * (np.exp(J) + np.exp(-J))

# 定义对数似然函数
def log_likelihood(J, data):
    logL = 0
    for s in data:
        logL += -hamiltonian(J, s)
    logL -= len(data) * np.log(partition_function(J))
    return -logL  # 最小化负对数似然

# 初始猜测
initial_J = 0.1

# 优化参数
result = minimize(log_likelihood, initial_J, args=(data,))
optimal_J = result.x[0]

print(f'MLE Estimated J: {optimal_J}')

蒙特卡罗方法（MCMC）

步骤

初始化模型参数。
生成样本：使用MCMC方法（如Metropolis-Hastings或Gibbs采样）生成自旋配置样本。
计算统计量：基于生成的样本，计算系统的期望统计量。
更新参数：使用梯度方法或其他优化技术调整模型参数。
重复步骤2-4，直到参数收敛。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1

# 吉布斯采样函数
def gibbs_sample(J, num_samples, burn_in):
    samples = []
    s = np.random.choice([-1, 1], size=2)
    for _ in range(num_samples + burn_in):
        for i in range(2):
            prob = 1 / (1 + np.exp(-2 * J * s[1 - i]))
            s[i] = 1 if np.random.rand() < prob else -1
        if _ >= burn_in:
            samples.append(s.copy())
    return np.array(samples)

# 计算期望统计量
def calculate_statistics(samples):
    correlations = np.mean(samples[:, 0] * samples[:, 1])
    return correlations

# 更新参数
def update_parameters(J, samples, data):
    data_corr = np.mean(data[:, 0] * data[:, 1])
    sample_corr = calculate_statistics(samples)
    learning_rate = 0.1
    J += learning_rate * (data_corr - sample_corr)
    return J

# 蒙特卡罗迭代
num_iterations = 100
num_samples = 1000
burn_in = 100

for _ in range(num_iterations):
    samples = gibbs_sample(J, num_samples, burn_in)
    J = update_parameters(J, samples, data)
    print(f'Iteration {_}: J = {J}')

print(f'Estimated J: {J}')

平均场近似（Mean Field Approximation）

步骤

定义Hamiltonian。
引入平均场近似：每个自旋的影响被近似为一个平均场。
计算自旋期望值：根据平均场计算自旋的期望值。
迭代求解：通过迭代更新每个自旋的期望值和相互作用参数。
更新相互作用参数：调整相互作用参数使得模型生成的期望值与观测数据的期望值匹配。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1

# 计算观测数据的期望值
mean_s1 = np.mean(data[:, 0])
mean_s2 = np.mean(data[:, 1])

# 定义迭代函数
def mean_field_iteration(J, mean_s1, mean_s2, max_iter=100, tol=1e-5):
    for _ in range(max_iter):
        h1 = J * mean_s2
        h2 = J * mean_s1
        new_mean_s1 = np.tanh(h1)
        new_mean_s2 = np.tanh(h2)
        if np.abs(new_mean_s1 - mean_s1) < tol and np.abs(new_mean_s2 - mean_s2) < tol:
            break
        mean_s1, mean_s2 = new_mean_s1, new_mean_s2
    return mean_s1, mean_s2

# 迭代求解期望值
mean_s1, mean_s2 = mean_field_iteration(J, mean_s1, mean_s2)

# 更新相互作用参数
def update_parameters(J, mean_s1, mean_s2, data):
    observed_corr = np.mean(data[:, 0] * data[:, 1])
    model_corr = mean_s1 * mean_s2
    learning_rate = 0.1
    J += learning_rate * (observed_corr - model_corr)
    return J

# 更新参数
J = update_parameters(J, mean_s1, mean_s2, data)

print(f'Estimated J: {J}')

伪似然估计（PLE）

步骤

定义条件概率： $\begin{array}{r} (1) & P (s_{i} | s_{∖ i}) = \frac{e^{s_{i} h_{i}}}{e^{h_{i}} + e^{- h_{i}}} \end{array}$
定义伪似然函数： $\begin{array}{r} (2) & P L (J) = \prod_{i = 1}^{n} \prod_{k = 1}^{N} P (s_{i}^{(k)} | s_{∖ i}^{(k)}) \end{array}$
取对数伪似然函数： $\begin{array}{r} (3) & \log P L (J) = \sum_{i = 1}^{n} \sum_{k = 1}^{N} \log P (s_{i}^{(k)} | s_{∖ i}^{(k)}) \end{array}$
优化对数伪似然函数：使用数值优化方法（如梯度下降）最大化对数伪似然函数。

示例代码

import numpy as np
from scipy.optimize import minimize

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 定义条件概率
def conditional_probability(s_i, s_j, J):
    return 1 / (1 + np.exp(-2 * J * s_i * s_j))

# 定义对数伪似然函数
def log_pseudolikelihood(J, data):
    logPL = 0
    for s in data:
        logPL += np.log(conditional_probability(s[0], s[1], J)) + np.log(conditional_probability(s[1], s[0], J))
    return -logPL  # 最小化负对数伪似然

# 初始猜测
initial_J = 0.1

# 优化参数
result = minimize(log_pseudolikelihood, initial_J, args=(data,))
optimal_J = result.x[0]

print(f'Optimal J: {optimal_J}')

对比散度（CD）

步骤

定义能量函数： $\begin{array}{r} (4) & E (s) = - \sum_{i < j} J_{i j} s_{i} s_{j} \end{array}$
初始化模型参数。
正向采样（Positive Phase）：从观测数据中采样，计算数据分布下的期望值。
负向采样（Negative Phase）：使用Gibbs采样从模型分布中生成样本，计算模型分布下的期望值。
更新参数：根据正向采样和负向采样的期望值差异，更新相互作用参数。
迭代，直到参数收敛。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1
learning_rate = 0.1
num_iterations = 100
num_samples = 1000
burn_in = 100

# 计算观测数据的期望值
mean_s1s2_data = np.mean(data[:, 0] * data[:, 1])

# 吉布斯采样函数
def gibbs_sample(J, num_samples, burn_in):
    samples = []
    s = np.random.choice([-1, 1], size=2)  # 初始自旋配置
    for _ in range(num_samples + burn_in):
        for i in range(2):
            prob = 1 / (1 + np.exp(-2 * J * s[1 - i]))
            s[i] = 1 if np.random.rand() < prob else -1
        if _ >= burn_in:
            samples.append(s.copy())
    return np.array(samples)

# 计算模型分布的期望值
def calculate_model_expectation(J, num_samples, burn_in):
    samples = gibbs_sample(J, num_samples, burn_in)
    mean_s1s2_model = np.mean(samples[:, 0] * samples[:, 1])
    return mean_s1s2_model

# 对比散度更新
for _ in range(num_iterations):
    mean_s1s2_model = calculate_model_expectation(J, num_samples, burn_in)
    J += learning_rate * (mean_s1s2_data - mean_s1s2_model)
    print(f'Iteration {_}: J = {J}')

print(f'CD Estimated J: {J}')

总结

逆Ising问题涉及从观测数据中推断Ising模型的相互作用参数。本文介绍了五种求解方法：极大似然估计（MLE）、蒙特卡罗方法（MCMC）、平均场近似、伪似然估计（PLE）以及对比散度（CD）。每种方法都有其优缺点，选择合适的方法取决于具体问题的规模、数据特性和计算资源。

Yixiong's Blog

Boltzmann Machine Append

逆Ising问题及其求解方法

引言

极大似然估计（MLE）

步骤

示例代码

蒙特卡罗方法（MCMC）

步骤

示例代码

平均场近似（Mean Field Approximation）

步骤

示例代码

伪似然估计（PLE）

步骤

示例代码

对比散度（CD）

步骤

示例代码

总结