Reclaiming the Lost Conformality in a non-Hermitian Quantum 5-state Potts Model

发表于 2024-03-20 更新于 2025-05-08 分类于 Physics
本文字数： 2.5k 阅读时长 ≈ 2 分钟

这篇文章并未读完，更多的内容在于知识上的补充

Abstract

共形对称发生在临界点，，但是在重整化群的相变点相撞的时候，这种对称性会消失。认为这种实平面的固定点将会变到复平面中。这篇工作，利用非厄米量子5态Potts模型，成功提取到了复平面的高度。

阅读全文 »

Deconstructing Denoising Diffusion Models for Self-Supervised Learning

发表于 2024-03-15 更新于 2025-05-08 分类于 Machine Learning
本文字数： 1.4k 阅读时长 ≈ 1 分钟

Abstract

这篇文章分析了 Denoising Diffusion Models(DDM) 在图像领域的表示能力。通过不断解构DDM，从而分析Transformer的性能。最终得出结论：仅仅有很少的几个参数是有用的，对最后的图像生成起到关键作用。

这点和全连接神经网络十分相似，当层数过多的时候，只有输入层附近的几层与输出层附近的几层是关键的，中间几层处于液化状态（可以随意选取，不会影响最终的结果）。

阅读全文 »

Policy Gradients In Reinforcement

发表于 2024-03-08 更新于 2025-05-08 分类于 Machine Learning
本文字数： 17k 阅读时长 ≈ 15 分钟

文中有一些问题仍未处理，缺失具体代码的解读，对于TRPO算法的认知仍然存在不清楚的地方，高阶梯度怎么算的

Abstract

这是一篇关于策略梯度算法的总结。首先给出梯度策略，介绍其基本含义，但是初始方案存在一个问题，可以知道梯度变化的方向，不知道梯度的步长。然后，提出自然梯度算法，通过加入约束的方案计算出梯度的步长。接下来，Trust Region Policy Optimization（TRPO）算法在此基础上进一步优化，进一步提出约束，使得满足该约束条件的样本可以稳定提升策略性能。最后，虽然TRPO十分优秀，但是大量的计算使其效率不高，因此进行简化提出Proximal Policy Optimization（PPO）算法。

基于值函数的强化学习：通过递归，求解bellman 方程维护Q值（离散列表或者神经网络），每次选择动作会选择该状态下对应Q值最大的动作。使得期望奖励值最大。

基于策略的强化学习：不再通过价值函数确定动作，而是直接学习策略本身，通过一组参数θ对策略进行参数化，并通过神经网络优化θ。

阅读全文 »

Neural Network Diffusion

发表于 2024-03-04 更新于 2025-05-08 分类于 Machine Learning
本文字数： 824 阅读时长 ≈ 1 分钟

Introduction

这篇文章的主要任务是，利用Diffusion Model生成具备高表现能力的神经网络参数。

利用 autoencoder 和 laten diffusion model 两个主要部件，其中autoencoder将网络参数进行提取，diffusion model再进行训练，然后再将训练好的模型进行解码。

阅读全文 »

ViT and ViViT

发表于 2024-02-29 更新于 2025-05-08 分类于 Machine Learning
本文字数： 1.4k 阅读时长 ≈ 1 分钟

简介

将 Transformer 架构加入视觉领域，ViT与ViViT是分别是将该架构加入图片分类与视频分类领域，是该方向的两篇代表作。

ViT: AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
ViViT: ViViT: A Video Vision Transformer

阅读全文 »

Sora原理分析

发表于 2024-02-28 更新于 2025-05-08 分类于 Machine Learning
本文字数： 929 阅读时长 ≈ 1 分钟

简介

sora完成了文本生成视频的任务，其中视频的时长与连贯性都有非常惊艳的效果，不仅将视频时长拓展到了60S的水平，而且即使视频中发生物品遮挡，在之后也能成功接上，视频整体非常连贯。

感谢Datawhale开源社区提供相关资源。

阅读全文 »

统计物理读书笔记

发表于 2024-01-28 更新于 2025-05-08 分类于 Statistical Physics
本文字数： 69k 阅读时长 ≈ 1:03

本笔记为阅读陈敏伯《统计物理》的读书笔记，包含大量基本概念与公式推导。按照本书前言所著，这本书大量使用变分原理进行推理基本公式。

阅读全文 »

Deep Unsupervised Learning using Nonequilibrium Thermodynamics

发表于 2024-01-22 更新于 2025-05-08 分类于 Machine Learning
本文字数： 4.5k 阅读时长 ≈ 4 分钟

简介

本篇文章来自于： Deep Unsupervised Learning using Nonequilibrium Thermodynamics，arXiv:1503.03585v8 [cs.LG] 18 Nov 2015

该篇文章为首次提出Deffusion Model的概念。算法的主要目标是构造一个前向传播、扩散的过程，通过这个过程可以将复杂的分布逐渐变为一个简单的分布。

阅读全文 »

Score matching model

发表于 2024-01-19 更新于 2025-05-08 分类于 Machine Learning
本文字数： 9.5k 阅读时长 ≈ 9 分钟

简介

这篇文章主要描述基于得分匹配（Score matching model）的想法，以及之后主要的修改思路。这种思路是生成模型的一种，与GAN、normal-flow等模型具备同样的功能。

本篇文章大量借鉴棒棒生博客，推荐阅读原文博客。本文章在其基础上加入一些作者本人的思考，并且统一符号，增加阅读流畅性。

阅读全文 »

Boltzmann Machine Append

发表于 2022-11-30 更新于 2025-05-08 分类于 Physics
本文字数： 5.4k 阅读时长 ≈ 5 分钟

逆Ising问题及其求解方法

引言

逆Ising问题涉及从观测数据中推断Ising模型的参数。Ising模型是一种简单的数学模型，用于描述磁性材料中的自旋系统。解决逆Ising问题的方法包括极大似然估计（MLE）、蒙特卡罗方法（MCMC）、平均场近似、伪似然估计（PLE）以及对比散度（CD）。

极大似然估计（MLE）

步骤

定义Hamiltonian: H(s) = −∑_i < jJ_ijs_is_j
定义配分函数: Z = ∑_se^−H(s)
定义似然函数: $$ L(J) = \prod_{k=1}^{N} P(\mathbf{s}^{(k)}|J) = \prod_{k=1}^{N} \frac{e^{-H(\mathbf{s}^{(k)})}}{Z} $$
取对数似然函数: $$ \log L(J) = -\sum_{k=1}^{N} H(\mathbf{s}^{(k)}) - N \log Z $$
优化对数似然函数: 使用数值优化方法（如梯度下降）最大化对数似然函数。

示例代码

import numpy as np
from scipy.optimize import minimize

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 定义Hamiltonian
def hamiltonian(J, s):
    return -J * s[0] * s[1]

# 定义配分函数
def partition_function(J):
    return 2 * (np.exp(J) + np.exp(-J))

# 定义对数似然函数
def log_likelihood(J, data):
    logL = 0
    for s in data:
        logL += -hamiltonian(J, s)
    logL -= len(data) * np.log(partition_function(J))
    return -logL  # 最小化负对数似然

# 初始猜测
initial_J = 0.1

# 优化参数
result = minimize(log_likelihood, initial_J, args=(data,))
optimal_J = result.x[0]

print(f'MLE Estimated J: {optimal_J}')

蒙特卡罗方法（MCMC）

步骤

初始化模型参数。
生成样本：使用MCMC方法（如Metropolis-Hastings或Gibbs采样）生成自旋配置样本。
计算统计量：基于生成的样本，计算系统的期望统计量。
更新参数：使用梯度方法或其他优化技术调整模型参数。
重复步骤2-4，直到参数收敛。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1

# 吉布斯采样函数
def gibbs_sample(J, num_samples, burn_in):
    samples = []
    s = np.random.choice([-1, 1], size=2)
    for _ in range(num_samples + burn_in):
        for i in range(2):
            prob = 1 / (1 + np.exp(-2 * J * s[1 - i]))
            s[i] = 1 if np.random.rand() < prob else -1
        if _ >= burn_in:
            samples.append(s.copy())
    return np.array(samples)

# 计算期望统计量
def calculate_statistics(samples):
    correlations = np.mean(samples[:, 0] * samples[:, 1])
    return correlations

# 更新参数
def update_parameters(J, samples, data):
    data_corr = np.mean(data[:, 0] * data[:, 1])
    sample_corr = calculate_statistics(samples)
    learning_rate = 0.1
    J += learning_rate * (data_corr - sample_corr)
    return J

# 蒙特卡罗迭代
num_iterations = 100
num_samples = 1000
burn_in = 100

for _ in range(num_iterations):
    samples = gibbs_sample(J, num_samples, burn_in)
    J = update_parameters(J, samples, data)
    print(f'Iteration {_}: J = {J}')

print(f'Estimated J: {J}')

平均场近似（Mean Field Approximation）

步骤

定义Hamiltonian。
引入平均场近似：每个自旋的影响被近似为一个平均场。
计算自旋期望值：根据平均场计算自旋的期望值。
迭代求解：通过迭代更新每个自旋的期望值和相互作用参数。
更新相互作用参数：调整相互作用参数使得模型生成的期望值与观测数据的期望值匹配。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1

# 计算观测数据的期望值
mean_s1 = np.mean(data[:, 0])
mean_s2 = np.mean(data[:, 1])

# 定义迭代函数
def mean_field_iteration(J, mean_s1, mean_s2, max_iter=100, tol=1e-5):
    for _ in range(max_iter):
        h1 = J * mean_s2
        h2 = J * mean_s1
        new_mean_s1 = np.tanh(h1)
        new_mean_s2 = np.tanh(h2)
        if np.abs(new_mean_s1 - mean_s1) < tol and np.abs(new_mean_s2 - mean_s2) < tol:
            break
        mean_s1, mean_s2 = new_mean_s1, new_mean_s2
    return mean_s1, mean_s2

# 迭代求解期望值
mean_s1, mean_s2 = mean_field_iteration(J, mean_s1, mean_s2)

# 更新相互作用参数
def update_parameters(J, mean_s1, mean_s2, data):
    observed_corr = np.mean(data[:, 0] * data[:, 1])
    model_corr = mean_s1 * mean_s2
    learning_rate = 0.1
    J += learning_rate * (observed_corr - model_corr)
    return J

# 更新参数
J = update_parameters(J, mean_s1, mean_s2, data)

print(f'Estimated J: {J}')

伪似然估计（PLE）

步骤

定义条件概率： $$\begin{align} P(s_i | \mathbf{s}_{\setminus i}) = \frac{e^{s_i h_i}}{e^{h_i} + e^{-h_i}} \end{align}$$
定义伪似然函数： $$\begin{align} PL(J) = \prod_{i=1}^n \prod_{k=1}^N P(s_i^{(k)} | \mathbf{s}_{\setminus i}^{(k)}) \end{align}$$
取对数伪似然函数： $$\begin{align} \log PL(J) = \sum_{i=1}^n \sum_{k=1}^N \log P(s_i^{(k)} | \mathbf{s}_{\setminus i}^{(k)}) \end{align}$$
优化对数伪似然函数：使用数值优化方法（如梯度下降）最大化对数伪似然函数。

示例代码

import numpy as np
from scipy.optimize import minimize

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 定义条件概率
def conditional_probability(s_i, s_j, J):
    return 1 / (1 + np.exp(-2 * J * s_i * s_j))

# 定义对数伪似然函数
def log_pseudolikelihood(J, data):
    logPL = 0
    for s in data:
        logPL += np.log(conditional_probability(s[0], s[1], J)) + np.log(conditional_probability(s[1], s[0], J))
    return -logPL  # 最小化负对数伪似然

# 初始猜测
initial_J = 0.1

# 优化参数
result = minimize(log_pseudolikelihood, initial_J, args=(data,))
optimal_J = result.x[0]

print(f'Optimal J: {optimal_J}')

对比散度（CD）

步骤

定义能量函数： $$\begin{align} E(\mathbf{s}) = -\sum_{i<j} J_{ij} s_i s_j \end{align}$$
初始化模型参数。
正向采样（Positive Phase）：从观测数据中采样，计算数据分布下的期望值。
负向采样（Negative Phase）：使用Gibbs采样从模型分布中生成样本，计算模型分布下的期望值。
更新参数：根据正向采样和负向采样的期望值差异，更新相互作用参数。
迭代，直到参数收敛。

示例代码

import numpy as np

# 观测数据
data = np.array([[1, 1], [1, -1], [-1, 1], [-1, -1]])

# 初始化参数
J = 0.1
learning_rate = 0.1
num_iterations = 100
num_samples = 1000
burn_in = 100

# 计算观测数据的期望值
mean_s1s2_data = np.mean(data[:, 0] * data[:, 1])

# 吉布斯采样函数
def gibbs_sample(J, num_samples, burn_in):
    samples = []
    s = np.random.choice([-1, 1], size=2)  # 初始自旋配置
    for _ in range(num_samples + burn_in):
        for i in range(2):
            prob = 1 / (1 + np.exp(-2 * J * s[1 - i]))
            s[i] = 1 if np.random.rand() < prob else -1
        if _ >= burn_in:
            samples.append(s.copy())
    return np.array(samples)

# 计算模型分布的期望值
def calculate_model_expectation(J, num_samples, burn_in):
    samples = gibbs_sample(J, num_samples, burn_in)
    mean_s1s2_model = np.mean(samples[:, 0] * samples[:, 1])
    return mean_s1s2_model

# 对比散度更新
for _ in range(num_iterations):
    mean_s1s2_model = calculate_model_expectation(J, num_samples, burn_in)
    J += learning_rate * (mean_s1s2_data - mean_s1s2_model)
    print(f'Iteration {_}: J = {J}')

print(f'CD Estimated J: {J}')

总结

逆Ising问题涉及从观测数据中推断Ising模型的相互作用参数。本文介绍了五种求解方法：极大似然估计（MLE）、蒙特卡罗方法（MCMC）、平均场近似、伪似然估计（PLE）以及对比散度（CD）。每种方法都有其优缺点，选择合适的方法取决于具体问题的规模、数据特性和计算资源。