当前位置:首页 > 工具 > 正文内容

从感知机到现代AI:1957年的神经元模型如何推动了AI革命

访客 工具 2026年7月2日 1

在1958年,《纽约时报》曾预测海军将创造出能够行走、说话、观察、写作并自我复制的机器。尽管这一愿景尚未完全实现,但AI已经以其他方式彻底改变了世界。2026年,AI正逐步从"生成式对话"转向"自主行动"的新纪元。

一、1957年:心理学教授与思考机器

康奈尔大学的心理学教授弗兰克·罗森布拉特(Frank Rosenblatt)于1957年尝试用电子元件模拟人类大脑的神经元,设计了名为Mark I 感知机的硬件设备。该设备包含400个光电探测器,用于模拟神经元连接权重,并通过电机更新这些权重。

  • Mark I的目标是识别图像。
  • 尽管当时的技术限制使得它只能处理非常简单的图像,但它激发了人们对真正人工智能的期望。

二、感知机的工作原理与代码实现

感知机的基本思想是接收多个输入信号,乘以各自的权重,加起来后如果总和超过某个阈值则"激活",否则保持"沉默"。以下是数学表示:

y = 0 (w1x1 + w2x2 ≤ θ)
y = 1 (w1x1 + w2x2 > θ)

通常我们将阈值θ转换为偏置b来简化计算:

y = 0 (b + w1x1 + w2x2 ≤ 0)
y = 1 (b + w1x1 + w2x2 > 0)

使用NumPy实现感知机

import numpy as np

def AND(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([0.5, 0.5])
    bias = -0.7
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(AND(0, 0))  # 输出 0
print(AND(1, 0))  # 输出 0
print(AND(0, 1))  # 输出 0
print(AND(1, 1))  # 输出 1

实现NAND门

def NAND(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([-0.5, -0.5])
    bias = 0.7
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(NAND(0, 0))  # 输出 1
print(NAND(1, 0))  # 输出 1
print(NAND(0, 1))  # 输出 1
print(NAND(1, 1))  # 输出 0

实现OR门

def OR(x1, x2):
    inputs = np.array([x1, x2])
    weights = np.array([0.5, 0.5])
    bias = -0.2
    total = np.sum(weights * inputs) + bias
    return 1 if total > 0 else 0

print(OR(0, 0))  # 输出 0
print(OR(1, 0))  # 输出 1
print(OR(0, 1))  # 输出 1
print(OR(1, 1))  # 输出 1

三、感知机的局限性

单层感知机无法解决异或(XOR)问题,因为没有一条直线可以将输出为0和1的点分开。

多层感知机解决XOR问题

def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    output = AND(s1, s2)
    return output

print(XOR(0, 0))  # 输出 0
print(XOR(1, 0))  # 输出 1
print(XOR(0, 1))  # 输出 1
print(XOR(1, 1))  # 输出 0

四、反向传播与MLP的发展

多层感知机通过引入非线性激活函数和隐藏层,可以学习复杂的非线性映射关系。反向传播算法通过梯度下降优化网络参数,使多层感知机成为可能。

五、从感知机到Transformer

感知机的核心思想奠定了深度学习的基础。从MP模型到GPT,每一步都是前人工作的延续和发展。

年份里程碑意义
1943MP模型神经网络理论基础
1957感知机第一个可学习的神经网络
1969《感知机》出版揭示单层感知机局限
1986反向传播普及多层网络训练成为可能
1998LeNet-5首个商用卷积神经网络
2012AlexNet深度学习在ImageNet竞赛中成功
2015ResNet解决梯度消失问题
2017Transformer注意力机制架构
2023-2024生成式AI爆发ChatGPT引领全球热潮
2026代理式AI兴起AI系统自主执行复杂任务

六、为什么学习感知机?

  1. 理解深度学习基础。
  2. 了解AI的局限与突破。
  3. 掌握AI发展的逻辑。
  4. 动手实践代码。

感知机作为深度学习的基石,帮助我们理解现代AI技术的根源。

相关文章

Trojan服务器搭建与配置

一、整体架构(先对齐认知)Clash Meta (PC / iOS / Android)        ↓ TLS   Trojan Server (443)        ↓     InternetTrojan 的核心是: TLS + HTTPS 流量伪装 看起来像正常网站 非常适合...

Tailscale 的详细用法

Tailscale 是一种基于 WireGuard 协议 的 零配置 VPN(虚拟私有网络)服务,让设备之间能够 安全、加密地直接连接,就像它们在同一个本地网络一样。它的核心特点是 简单、安全、跨平台。Tailscale 非常适合 没有公网 IP、两台电脑不在同一局域网 的场景。 简单来说,Tailscale 是什么?Tailscale 是一款让你的各种设备(电脑、服务器、手机...

Clash Tun 模式 导致 爱快(iKuai SD-Wan)内网域名无法访问

一、Clash  DNS 配置dns:  enable: true  listen: 0.0.0.0:53  ipv6: true  enhanced-mode: redir-host  nameserver:    - 223.5.5.5    - 223.6.6.6iKuai 内网域名 ...

深入解析Node.js运行环境与异步I/O架构

深入解析Node.js运行环境与异步I/O架构

核心定义与价值Node.js本质上是一个JavaScript运行环境,而非编程语言或应用框架。它赋予了JavaScript脱离浏览器在服务端、命令行工具及网络应用中执行的能力。其核心意义在于:用单一语言打通前后端开发壁垒。基于事件驱动与非阻塞I/O的架构特性,Node.js在处理API网关、实时通信及微服务等I/O密集型场景时表现卓越,已成为现代后端工程的主流选择。浏览器沙箱限制1995年Java...

ADO.NET SQL参数化查询的最佳实践

在 ADO.NET 中执行 SQL 查询时,参数化查询是一种关键的安全措施和性能优化手段。它通过将 SQL 命令和用户提供的数据分开处理,有效防止了 SQL 注入攻击,并有助于数据库缓存执行计划。下面总结了几种常用的参数化查询方式。 1. 使用 SqlParameter 对象(推荐) 这是最推荐的参数化查询方式。通过显式创建 SqlParameter 对象,您可以精确控制参数的类...

基于ELK的日志集中化分析系统搭建

构建统一日志管理平台的必要性 在分布式架构中,各服务节点独立运行,日志分散存储于不同主机。传统通过命令行工具如grep、awk逐个检索日志的方式,在数据量庞大时效率极低,难以实现快速定位问题。为提升运维效率,需建立集中式日志处理体系,具备日志采集、传输、存储、分析与告警能力。 ELK技术栈核心组件解析 Elasticsearch:分布式搜索引擎,支持全文检索、实时数据分析和高可用集群部署,...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。