大三下学期考研就业两手抓,三个月上岸清深数据科学和信息技术,在此分享下经验:

📌本人背景

c9计算机专业应届生,绩点3.3,两年robocon选手,接受考研与本科就业,尽量不接受二战。

⏰时间线

2024年3月的大三下学期,本人意外发现自己失去了保研名额。因此我的大三下整体是就业考研两手抓,后续也可以就这两条主线分别讲一下。
首先我的想法是,珍惜应届生身份在就业方面的巨大优势,一定不能放弃就业这个选择。因此,如果能在正式开始考研前拿到一个不错的offer作为保底,即使考研失利依然可以以应届身份入职拿到不错的薪资,然后考虑专心工作或在职二战,坚决避免脱产二战(一旦失利可能陷入恶性循环)。3月开学后我开始投实习,5月入职某中厂进行嵌入式系统开发,成功在8月底拿到转正offer,同时借助实习经历与这个offer,argue到了其他一些可供我选择的offer。9月返校除了秋招面试之外,处理了一些其他杂事,最终签下三方,正式为三个月的考研做好保底。

阅读全文 »

Tactile DreamFusion: Exploiting Tactile Sensing for 3D Generation

  • 现有的文本到3d生成,图片到3d生成效果过于光滑或得到错误的反照率贴图;
  • 现有2d和3d数据集没有高分辨率数据:相机分辨率不够难以拍到,同时人类自然语言也很难准确描述细节纹理;
  • 因此我们用触觉来捕捉高分辨率纹理细节,增强3d生成结果的表面纹理表现;
  • 同时我们可以根据自然语言描述,自动完成物体不同部位不同纹理的合成。
阅读全文 »

要配置 SSH 免密登录(即使用 SSH 密钥认证),可以按照以下步骤操作:


假设环境

  • 本地主机(Client) :你当前使用的电脑
  • 远程服务器(Server) :你要免密登录的目标机器
  • 用户名user
  • 服务器 IP192.168.1.100

阅读全文 »

查看sudo权限

查看所有可登陆的用户

1
awk -F: '$7 ~ /(bash|sh)/ {print $1}' /etc/passwd

查看当前在线的用户

1
who

查看某个用户(如alice)是否有sudo权限

1
groups alice
  • 如果有会显示:
1
alice : alice sudo
  • 如果没有会显示:
1
alice : alice

接下来给该用户添加sudo权限。

阅读全文 »

Miniconda3 Linux安装教程

Miniconda是一个轻量级的Anaconda发行版,它允许用户安装和管理多个Python环境。以下是在Linux系统中安装Miniconda3的步骤:

阅读全文 »

设置Dock栏自动隐藏的触发速度

Dock 显示和隐藏速度,系统默认设置成了1秒

通过终端.APP修改显示和隐藏的时间 (单位:秒)

  • 默认的:
1
defaults write com.apple.dock autohide-delay -int 1
  • 优化的:
1
2
3
4
5
6
7
defaults write com.apple.dock autohide-delay -int 0.8  

defaults write com.apple.dock autohide-delay -int 0.6  

defaults write com.apple.dock autohide-delay -int 0.5  

defaults write com.apple.dock autohide-delay -int 0

所有操作执行完后需要执行:

1
killall Dock
阅读全文 »

项目地址:
VLM: https://gitee.com/feng-xie-yi/vlm_car
RL: https://gitee.com/momaoto/rl-locomotion-mujoco

项目信息

选题思路

现有跨形态机器人控制需为不同硬件单独设计策略,开发成本高且泛化性差。本课题尝试使用语言指令统一接口,用户用自然语言指挥不同形态机器人完成同一任务,通过分层强化学习框架,高层视觉语言模型(VLM)解析任务生成中间指令,再通过低层强化学习策略适配不同形态的底层动作,通过仿真器快速训练跨形态通用策略,最后部署到真机运行。

阅读全文 »

第一篇

一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。

  • 感知:传感器,用于获取环境信息,如雷达、深度相机、麦克风。
  • 决策:“大模型”,输入目标与指令,输出决策指令(导航路线、动作序列等)。
    • VLA:Vision-Language-Action,输出动作
    • VLN:Vision-Language-Nevigation,输出路线
  • 行动:三种思路:
    • 决策调用行动:行动被写成算法以供决策模块调用,缺点泛化能力差
    • 决策与行动协同:行动的同时获取实时信息,使决策不断优化,缺点吃算力
    • 决策与行动融合:端到端,利用多模态技术发展直接从感知推理出环境变化,以及相应的动作序列。是未来发展的方向。优点泛化能力强,通用。
  • 反馈:为上述每一个环节提供反馈。
0%