技术文摘
Python 简单神经网络创建教程(含代码)
2024-12-31 12:54:39 小编
Python 简单神经网络创建教程(含代码)
在当今的人工智能和机器学习领域,神经网络扮演着至关重要的角色。Python 作为一种强大而灵活的编程语言,为创建神经网络提供了丰富的库和工具。在本文中,我们将一起探索如何使用 Python 创建一个简单的神经网络。
我们需要导入所需的库。numpy 库用于数值计算,matplotlib 库用于数据可视化。
import numpy as np
import matplotlib.pyplot as plt
接下来,定义神经网络的类。这个类包含了初始化函数、前向传播函数和反向传播函数。
class NeuralNetwork:
def __init__(self, input_size, hidden_size, output_size):
self.input_size = input_size
self.hidden_size = hidden_size
self.output_size = output_size
# 随机初始化权重
self.W1 = np.random.randn(self.input_size, self.hidden_size)
self.b1 = np.zeros((1, self.hidden_size))
self.W2 = np.random.randn(self.hidden_size, self.output_size)
self.b2 = np.zeros((1, self.output_size))
def forward(self, X):
self.z1 = np.dot(X, self.W1) + self.b1
self.a1 = np.tanh(self.z1)
self.z2 = np.dot(self.a1, self.W2) + self.b2
self.a2 = np.exp(self.z2) / np.sum(np.exp(self.z2), axis=1, keepdims=True)
return self.a2
def backward(self, X, y, learning_rate):
# 反向传播的计算
m = X.shape[0]
dZ2 = self.a2 - y
dW2 = np.dot(self.a1.T, dZ2) / m
db2 = np.sum(dZ2, axis=0, keepdims=True) / m
dZ1 = np.dot(dZ2, self.W2.T) * (1 - np.power(self.a1, 2))
dW1 = np.dot(X.T, dZ1) / m
db1 = np.sum(dZ1, axis=0, keepdims=True) / m
# 更新权重
self.W1 -= learning_rate * dW1
self.b1 -= learning_rate * db1
self.W2 -= learning_rate * dW2
self.b2 -= learning_rate * db2
然后,准备数据并进行训练。
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0, 1], [1, 0], [1, 0], [0, 1]])
nn = NeuralNetwork(2, 4, 2)
epochs = 1000
learning_rate = 0.1
for epoch in range(epochs):
nn.forward(X)
nn.backward(X, y, learning_rate)
最后,我们可以对新的数据进行预测。
通过以上步骤,我们成功创建了一个简单的神经网络,并能够对数据进行训练和预测。希望这个教程能帮助您初步理解和掌握 Python 中神经网络的创建过程。随着深入学习,您可以进一步优化网络结构、调整超参数以获得更好的性能。
TAGS: Python 神经网络代码 简单神经网络
- 源头解决 Service Mesh 问题最为彻底
- 利用 Arthas 解决开源 Excel 组件的问题
- GitHub 发布 AI 编程工具:能将注释自动转为代码
- VS Code 可自行编程,GitHub 推出“AI 程序员”插件
- 远程真机调试与 Cocos 开发鸿蒙游戏:终于等到,真香!
- Redisson 分布式锁公平锁加锁的源码解析
- 程序员炒股维持游戏开发 一年竟赚 1600 万
- 操作系统视角下的 Java IO 演进历程
- 微软旗下 GitHub 欲借人工智能洞悉软件开发者心思
- 字节二面:trie 树的定义与应用
- 前端 Vue 应用的自动化测试
- Python 获取微信好友数据并进行可视化分析的发现
- Python 引入 global 和 nonlocal 这两个关键词的原因
- 深入解读抽象泄漏(Leaky Abstractions)
- 十分钟读懂 Java 泛型擦除详解