-
Notifications
You must be signed in to change notification settings - Fork 11
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
问问题 #1
Comments
XX XU看懂了DXX还是不理解 |
X2=XX*kron(eye(xn),K'); % |
是onpolicy还是offpolicy |
|
R被设置为单位阵 |
X1=[Dxx,-X2-XU]; % Left-hand side of the key equation |
我想问一下,代码: dx=Ax+Bu; dxx=kron(x',x')'; dux=kron(x',u')'; dX=[dx;dxx;dux];求解δ_xx,I_xx,I_xu时状态x的更新还要依赖于状态空间方程中的A、B,为什么说不需要系统矩阵? |
我感觉是作者想要利用AB去产生一些系统的状态,利用状态去计算P,K。可以用A.B矩阵得到状态,也可以用其他方法得到状态,得到状态后使用这个方法就不需要AB。 |
|
也就是说实际系统里的状态可以由传感器获得,这里只是模拟这个过程?还有个问题,你有用这个算法试过不稳定系统吗 |
我认为是这样的,没有试过,我不明白不稳定系统是什么,但是作者代码在输入状态时有引入噪声这个算吗,我也是才接触控制理论。 |
|
我也是初学者,可以一起讨论下吗 |
不稳定系统也可以收敛,但是需要多试几次。尝试了2016年Tao Bian 论文中的手臂移动模型,不满足稳定系统要求(特征值实部不全为负)但是利用这个代码多跑几次会收敛。我觉得是初始值问题,因为算法要求稳定系统的k0才是0,如果是不稳定的系统需要找一个稳定的初值,能收敛的原因可能是探索噪声找到了合适的DXX Ixx Ixu. |
论文题目能发一下吗 |
value iteration and adaptive Dynamic programming for data driven adaptive optimal control design。这个论文用的是基于价值迭代的adp算法,用的手臂移动的事例。这个算法不需要稳定的初始值。
发自我的iPhone
…------------------ 原始邮件 ------------------
发件人: Hybrid-z ***@***.***>
发送时间: 2023年9月5日 02:14
收件人: yu-jiang/Paper_Automatica2012_CTLTI ***@***.***>
抄送: ran1206 ***@***.***>, Comment ***@***.***>
主题: Re: [yu-jiang/Paper_Automatica2012_CTLTI] 问问题 (Issue #1)
不稳定系统也可以收敛,但是需要多试几次。尝试了2016年Tao Bian 论文中的手臂移动模型,不满足稳定系统要求(特征值实部不全为负)但是利用这个代码多跑几次会收敛。我觉得是初始值问题,因为算法要求稳定系统的k0才是0,如果是不稳定的系统需要找一个稳定的初值,能收敛的原因可能是探索噪声找到了合适的DXX Ixx Ixu.
论文题目能发一下吗
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
Yes, you are right |
因为这是仿真,在实际中你可以直接测量和收集物理系统的状态。这里没有物理系统,所以用仿真产生物理系统的轨迹。 |
你好,老师,A Unified Framework for Data-Driven Optimal |
学长/老师您好:我知道
Dxx=[Dxx;kron(X(end,1:xn),X(end,1:xn))-kron(X(1,1:xn),X(1,1:xn))];
XX=[XX;X(end,xn+1:xn+xn^2)-X(1,xn+1:xn+xn^2)];
XU=[XU;X(end,xn+xn^2+1:end)-X(1,xn+xn^2+1:end)];对应的是δxx = [¯x(t1) − ¯x(t0), ¯x(t2) − ¯x(t1), . . . , ¯x(tl) − ¯x(tl−1)]T ,和Ixu
能详细解释一下其公式吗?(我是初学者)
The text was updated successfully, but these errors were encountered: