ioo0s's blog

Q-Learning 是一个离线策略（off-policy）学习算法。在Q-Learning中，智能体学习的是一个与其实际执行动作无关的优化策略。也就是说，当它在探索更多的状态-动作对时，它学习的是最优策略。同时，在更新q-table中的值时，并不考虑下一步实际执行的动作是什么，而是假设采取的是让next_state下q-table值最大的动作。

乔姆斯基生成语法分析笔记

常见短语

短语缩写	构成	例子	中文名称
NP	NP->NN	武器	名词短语
DP	D+NP	那书	限定词短语
AP	ADJ+NP	干净的水	形容词短语
AP	ADV+ADJP	很晚	副词短语
VP	V+DP	读书	动词短语
PP	P+DP	在桌子上	介词短语
ConJP	DP+Conj+DP	一支笔和一本书	并列结构连词短语
S（IP）	DP+VP		句子/通常会用TP代替IP带时态
IP	D+I+V+D+N 代词 + 动词 + 曲折变化 + 代词 + 名词		句子/其中I 指曲折变化

Apollo 8.0教程

环境搭建

按照apollo.baidu.com中的教程进行创建

git clone https://github.com/ApolloAuto/apollo.git
bashdocker/scripts/dev_start.sh

CVE-2023-21608

Shellcode 分析

目的

为了改造该 exp 为远程命令执行，还需要对 shellcode 进行修改

前置知识

PEB

内容引用自 x32 PEB: 获取 Kernel32 基地址的原理及实现 - 先知社区

TEB（Thread Environment Block，线程环境块）系统在此 TEB 中保存频繁使用的线程相关的数据。位于用户地址空间，在比 PEB 所在地址低的地方。用户模式下，当前线程的 TEB 位于独立的 4KB 段(页)，可通过 CPU 的 FS 寄存器来访问该段，一般存储在[FS:0]

GNS3-mipsel-环境搭建

配置过程

GNS3-vm 配置

gns3-vm 服务默认只支持 x86-x64 系列模拟，并不支持其他架构如：arm、mips 等等。

juniper-1day-任意目录读

测试版本

junos-vsrx3-x86-64-20.3R1.8.ide.ova

juniper-jweb环境搭建

系统信息

junos 版本：junos-vsrx3-x86-64-20.3R1.8.ide.ova

VMware 版本：17.0.0 build-20800274

Ubuntu 版本：Ubuntu 22.04

FIoTFuzzer

该论文是在 Snipuzz 实现的基础上做的改进优化，着重说明了有的节点和处理方法，最终获得了很好的效果。但是论文并没有附加开源项目，本人是基于该理论描述的 fuzz 架构做了具体的实现，开源时间待定。