当前位置：首页 > 工具 > 正文内容

从感知机到现代AI：1957年的神经元模型如何推动了AI革命

访客工具 2026年7月2日 1

在1958年，《纽约时报》曾预测海军将创造出能够行走、说话、观察、写作并自我复制的机器。尽管这一愿景尚未完全实现，但AI已经以其他方式彻底改变了世界。2026年，AI正逐步从"生成式对话"转向"自主行动"的新纪元。

一、1957年：心理学教授与思考机器

康奈尔大学的心理学教授弗兰克·罗森布拉特（Frank Rosenblatt）于1957年尝试用电子元件模拟人类大脑的神经元，设计了名为Mark I 感知机的硬件设备。该设备包含400个光电探测器，用于模拟神经元连接权重，并通过电机更新这些权重。

Mark I的目标是识别图像。
尽管当时的技术限制使得它只能处理非常简单的图像，但它激发了人们对真正人工智能的期望。

二、感知机的工作原理与代码实现

感知机的基本思想是接收多个输入信号，乘以各自的权重，加起来后如果总和超过某个阈值则"激活"，否则保持"沉默"。以下是数学表示：

y = 0 (w1x1 + w2x2 ≤ θ)
y = 1 (w1x1 + w2x2 > θ)

通常我们将阈值θ转换为偏置b来简化计算：

y = 0 (b + w1x1 + w2x2 ≤ 0)
y = 1 (b + w1x1 + w2x2 > 0)

使用NumPy实现感知机

import numpy as np

def AND(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([0.5, 0.5])
    bias = -0.7
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(AND(0, 0))  # 输出 0
print(AND(1, 0))  # 输出 0
print(AND(0, 1))  # 输出 0
print(AND(1, 1))  # 输出 1

实现NAND门

def NAND(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([-0.5, -0.5])
    bias = 0.7
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(NAND(0, 0))  # 输出 1
print(NAND(1, 0))  # 输出 1
print(NAND(0, 1))  # 输出 1
print(NAND(1, 1))  # 输出 0

实现OR门

def OR(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([0.5, 0.5])
    bias = -0.2
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(OR(0, 0))  # 输出 0
print(OR(1, 0))  # 输出 1
print(OR(0, 1))  # 输出 1
print(OR(1, 1))  # 输出 1

三、感知机的局限性

单层感知机无法解决异或（XOR）问题，因为没有一条直线可以将输出为0和1的点分开。

多层感知机解决XOR问题

def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    output = AND(s1, s2)
    return output

print(XOR(0, 0))  # 输出 0
print(XOR(1, 0))  # 输出 1
print(XOR(0, 1))  # 输出 1
print(XOR(1, 1))  # 输出 0

四、反向传播与MLP的发展

多层感知机通过引入非线性激活函数和隐藏层，可以学习复杂的非线性映射关系。反向传播算法通过梯度下降优化网络参数，使多层感知机成为可能。

五、从感知机到Transformer

感知机的核心思想奠定了深度学习的基础。从MP模型到GPT，每一步都是前人工作的延续和发展。

年份	里程碑	意义
1943	MP模型	神经网络理论基础
1957	感知机	第一个可学习的神经网络
1969	《感知机》出版	揭示单层感知机局限
1986	反向传播普及	多层网络训练成为可能
1998	LeNet-5	首个商用卷积神经网络
2012	AlexNet	深度学习在ImageNet竞赛中成功
2015	ResNet	解决梯度消失问题
2017	Transformer	注意力机制架构
2023-2024	生成式AI爆发	ChatGPT引领全球热潮
2026	代理式AI兴起	AI系统自主执行复杂任务

六、为什么学习感知机？

理解深度学习基础。
了解AI的局限与突破。
掌握AI发展的逻辑。
动手实践代码。

感知机作为深度学习的基石，帮助我们理解现代AI技术的根源。

标签: 感知机深度学习反向传播 Transformer

返回列表

上一篇：Unity Shader 顶点着色器实战案例

下一篇：代理工具

老程序员博客

从感知机到现代AI：1957年的神经元模型如何推动了AI革命

一、1957年：心理学教授与思考机器

二、感知机的工作原理与代码实现

使用NumPy实现感知机

实现NAND门

实现OR门

三、感知机的局限性

多层感知机解决XOR问题

四、反向传播与MLP的发展

五、从感知机到Transformer

六、为什么学习感知机？

相关文章

Trojan服务器搭建与配置

Tailscale 的详细用法

Clash Tun 模式导致爱快(iKuai SD-Wan)内网域名无法访问

深入解析Node.js运行环境与异步I/O架构

ADO.NET SQL参数化查询的最佳实践

基于ELK的日志集中化分析系统搭建

发表评论

Copyright © agingcoder.cn

Powered By Z-BlogPHP. Theme by TOYEAN.

老程序员博客

从感知机到现代AI：1957年的神经元模型如何推动了AI革命

一、1957年：心理学教授与思考机器

二、感知机的工作原理与代码实现

使用NumPy实现感知机

实现NAND门

实现OR门

三、感知机的局限性

多层感知机解决XOR问题

四、反向传播与MLP的发展

五、从感知机到Transformer

六、为什么学习感知机？

相关文章

Trojan服务器搭建与配置

Tailscale 的详细用法

Clash Tun 模式 导致 爱快(iKuai SD-Wan)内网域名无法访问

深入解析Node.js运行环境与异步I/O架构

ADO.NET SQL参数化查询的最佳实践

基于ELK的日志集中化分析系统搭建

发表评论取消回复

Copyright © agingcoder.cn

Powered By Z-BlogPHP. Theme by TOYEAN.

Clash Tun 模式导致爱快(iKuai SD-Wan)内网域名无法访问

发表评论